Diagnosis of diseases associated with metabolism

ABSTRACT

Chemically modified genomic sequences of genes associated with metabolism, to oligonucleotides and/or PNA-oligomers for detecting the cytosine methylation state of genes associated with metabolism which are directed against the sequence are disclosed. In addition, a method for ascertaining genetic and/or epigenetic parameters of genes associated with metabolism is disclosed.

FIELD OF THE INVENTION

[0001] The levels of observation that have been well studied by themethodological developments of recent years in molecular biology, arethe genes themselves, the translation of these genes into RNA, and theresulting proteins. The question of which gene is switched on at whichpoint in the course of the development of an individual, and how theactivation and inhibition of specific genes in specific cells andtissues are controlled is correlatable to the degree and character ofthe methylation of the genes or of the genome. In this respect,pathogenic conditions may manifest themselves in a changed methylationpattern of individual genes or of the genome.

[0002] The present invention relates to nucleic acids, oligonucleotides,PNA-oligomers and to a method for the diagnosis and/or therapy ofdiseases which have a connection with the genetic and/or epigeneticparameters of genes associated with metabolism and, in particular, withthe methylation status thereof.

PRIOR ART

[0003] Metabolism is the sum of chemical changes that occur in livingorganisms. The thousands of different chemical reactions are carried outsimultaneously by a cell are closely coordinated. A variety of controlmechanisms regulate the activities of key enzymes in response tochanging conditions in the cell. One very common form of regulation is arapidly reversible feedback inhibition exerted on the first enzyme bythe final product of that pathway. A longer lasting form of regulationinvolves the chemical modification of one enzyme by another.Combinations of regulatory mechanisms can produce major and long lastingchanges in the metabolism of the cell. Common metabolic diseases arediabetes, cancer, hyperlipidaemia and atherosclerosis. Cancer, forexample, is a multistep disease with a multifactorial aetiology. Forsome genotoxic carcinogens the sequence of events leading to tumourformation is well understood from exposure, to metabolism and ultimatelyto specific mutations in transformation-associated genes. In thewidespread field of metabolic diseases, enzymes, which play a centralrole in glucose metabolism, like Human hexokinase, are contributing todiseases like pre-non-insulin-dependent diabetes mellitus (Diabetes 1995March;44(3):347-53 Identification of four amino acid substitutions inhexokinase II and studies of relationships to NIDDM, glucoseeffectiveness, and insulin sensitivity. Echwald S M, Bjorbaek C, HansenT, Clausen J O, Vestergaard H, Zierath J R, Printz R L, Granner D K,Pedersen O). Other metabolism based disorders are peroxisomal disorders(Enzyme 1987;38(1-4):161-76 Genetic diseases caused by peroxisomaldysfunction. New findings in clinical and biochemical studies. SchutgensR B, Wanders R J, Nijenhuis A, van den Hoek C M, Heymans H S, SchrakampG, Bleeker-Wagemakers E M, Delleman J W, Schram A W, Tager J M, et al.).Those disorders are a group of genetic diseases caused by peroxisomaldysfunction. Alcohol-induced oxidative stress, another metabolicdisease, is linked to the metabolism of ethanol (J Biomed Sci 2001January-February;8(1):59-70, Oxidative stress, metabolism of ethanol andalcohol-related diseases. Zima T, Fialova L, Mestek O, Janebova M,Crkovska J, Malbohan I, Stipek S, Mikulikova L, Popov P). Threemetabolic pathways of ethanol have been described in the human body sofar. Some other described metabolic diseases are hereditary tyrosinemiatype I, which is the most severe metabolic disease of the tyrosinecatabolic pathway mainly affecting the liver (FASEB J 1999December;13(15):2284-98 Cyclin B-dependent kinase and caspase-1activation precedes mitochondrial dysfunction infumarylacetoacetate-induced apoptosis. Jorquera R, Tanguay R M),methylmalonic acidemia (Hum Gene Ther 1994 September;5(9):1095-104Overexpression of human methylmalonyl CoA mutase in mice after in vivogene transfer with asialoglycoprotein/polylysine/DNA complexes.Stankovics J, Crane A M, Andrews E, Wu C H, Wu G Y, Ledley F D) orpropionic acidemia (Hum Genet 1991 May;87(1):41-4 Genetic heterogeneityof propionic acidemia: analysis of 15 Japanese patients. Ohura T,Miyabayashi S, Narisawa K, Tada K Department of Pediatrics, TohokuUniversity School of Medicine, Sendai, Japan).

[0004] The high incidence of metabolic diseases has given rise to thedevelopment of methods of treatment and diagnosis targeted specificallyto metabolic pathways. The further development of such methods wouldhave considerable benifits. For example, cancer where current therapiesmay have unwanted side effects or fail to provide effective treatment.Conventional methods such as chemotherapy, which with their massive sideeffects, sometimes result in unacceptable morbidity or lead up to thedeath of the patient. In practice, the unwanted side effects associatedwith cancer therapies frequently limit the treatment which could help apatient.

[0005] 5-methylcytosine is the most frequent covalent base modificationin the DNA of eukaryotic cells. It plays a role, for example, in theregulation of the transcription, in genetic imprinting, and intumorigenesis. Therefore, the identification of 5-methylcytosine as acomponent of genetic information is of considerable interest. However,5-methylcytosine positions cannot be identified by sequencing since5-methylcytosine has the same base pairing behavior as cytosine.Moreover, the epigenetic information carried by 5-methylcytosine iscompletely lost during PCR amplification.

[0006] A relatively new and currently the most frequently used methodfor analyzing DNA for 5-methylcytosine is based upon the specificreaction of bisulfite with cytosine which, upon subsequent alkalinehydrolysis, is converted to uracil which corresponds to thymidine in itsbase pairing behavior. However, 5-methylcytosine remains unmodifiedunder these conditions. Consequently, the original DNA is converted insuch a manner that methylcytosine, which originally could not bedistinguished from cytosine by its hybridization behavior, can now bedetected as the only remaining cytosine using “normal” molecularbiological techniques, for example, by amplification and hybridizationor sequencing. All of these techniques are based on base pairing whichcan now be fully exploited. In terms of sensitivity, the prior art isdefined by a method which encloses the DNA to be analyzed in an agarosematrix, thus preventing the diffusion and renaturation of the DNA(bisulfite only reacts with single-stranded DNA), and which replaces allprecipitation and purification steps with fast dialysis (Olek A, OswaldJ, Walter J. A modified and improved method for bisulphite basedcytosine methylation analysis. Nucleic Acids Res. 1996 Dec. 15;24(24):5064-6). Using this method, it is possible to analyze individualcells, which illustrates the potential of the method. However, currentlyonly individual regions of a length of up to approximately 3000 basepairs are analyzed, a global analysis of cells for thousands of possiblemethylation events is not possible. However, this method cannot reliablyanalyze very small fragments from small sample quantities either. Theseare lost through the matrix in spite of the diffusion protection.

[0007] An overview of the further known methods of detecting5-methylcytosine may be gathered from the following review article:Rein, T., DePamphilis, M. L., Zorbas, H., Nucleic Acids Res. 1998, 26,2255.

[0008] To date, barring few exceptions (e.g., Zeschnigk M, Lich C,Buiting K, Doerfler W, Horsthemke B. A single-tube PCR test for thediagnosis of Angelman and Prader-Willi syndrome based on allelicmethylation differences at the SNRPN locus. Eur J Hum Genet. 1997March-April;5(2):94-8) the bisulfite technique is only used in research.Always, however, short, specific fragments of a known gene are amplifiedsubsequent to a bisulfite treatment and either completely sequenced(Olek A, Walter J. The preimplantation ontogeny of the H19 methylationimprint. Nat Genet. 1997 November;17(3):275-6) or individual cytosinepositions are detected by a primer extension reaction (Gonzalgo M L,Jones P A. Rapid quantitation of methylation differences at specificsites using methylation-sensitive single nucleotide primer extension(Ms-SNuPE). Nucleic Acids Res. 1997 Jun. 15;25(12):2529-31, WO Patent95/00669) or by enzymatic digestion (Xiong Z, Laird P W. COBRA: asensitive and quantitative DNA methylation assay. Nucleic Acids Res.1997 Jun. 15;25(12):25324). In addition, detection by hybridization hasalso been described (Olek et al., WO 99/28498).

[0009] Further publications dealing with the use of the bisulfitetechnique for methylation detection in individual genes are: Grigg G,Clark S. Sequencing 5-methylcytosine residues in genomic DNA. Bioessays.1994 June;16(6):431-6, 431; Zeschnigk M, Schmitz B, Dittrich B, BuitingK, Horsthemke B, Doerfler W. Imprinted segments in the human genome:different DNA methylation patterns in the Prader-Willi/Angelman syndromeregion as determined by the genomic sequencing method. Hum Mol Genet.1997 March;6(3):387-95; Feil R, Chariton J, Bird A P, Walter J, Reik W.Methylation analysis on individual chromosomes: improved protocol forbisulphite genomic sequencing. Nucleic Acids Res. 1994 Feb.25;22(4):695-6; Martin V, Ribieras S, Song-Wang X, Rio M C, Dante R.Genomic sequencing indicates a correlation between DNA hypomethylationin the 5′ region of the pS2 gene and its expression in human breastcancer cell lines. Gene. 1995 May 19;157(1-2):261-4; WO 97/46705, WO95/15373 and WO 97/45560.

[0010] An overview of the Prior Art in oligomer array manufacturing canbe gathered from a special edition of Nature Genetics (Nature GeneticsSupplement, Volume 21, January 1999), published in January 1999, andfrom the literature cited therein.

[0011] Fluorescently labeled probes are often used for the scanning ofimmobilized DNA arrays. The simple attachment of Cy3 and Cy5 dyes to the5′-OH of the specific probe are particularly suitable for fluorescencelabels. The detection of the fluorescence of the hybridized probes maybe carried out, for example via a confocal microscope. Cy3 and Cy5 dyes,besides many others, are commercially available.

[0012] Matrix Assisted Laser Desorption Ionization Mass Spectrometry(MALDI-TOF) is a very efficient development for the analysis ofbiomolecules (Karas M, Hillenkamp F. Laser desorption ionization ofproteins with molecular masses exceeding 10,000 daltons. Anal Chem. 1988Oct 15;60(20):2299-301). An analyte is embedded in a light-absorbingmatrix. The matrix is evaporated by a short laser pulse thustransporting the analyte molecule into the vapor phase in anunfragmented manner. The analyte is ionized by collisions with matrixmolecules. An applied voltage accelerates the ions into a field-freeflight tube. Due to their different masses, the ions are accelerated atdifferent rates. Smaller ions reach the detector sooner than biggerones.

[0013] MALDI-TOF spectrometry is excellently suited to the analysis ofpeptides and proteins. The analysis of nucleic acids is somewhat moredifficult (Gut I G, Beck S. DNA and Matrix Assisted Laser DesorptionIonization Mass Spectrometry. Current Innovations and Future Trends.1995, 1; 147-57). The sensitivity to nucleic acids is approximately 100times worse than to peptides and decreases disproportionally withincreasing fragment size. For nucleic acids having a multiply negativelycharged backbone, the ionization process via the matrix is considerablyless efficient. In MALDI-TOF spectrometry, the selection of the matrixplays an eminently important role. For the desorption of peptides,several very efficient matrixes have been found which produce a veryfine crystallization. There are now several responsive matrixes for DNA,however, the difference in sensitivity has not been reduced. Thedifference in sensitivity can be reduced by chemically modifying the DNAin such a manner that it becomes more similar to a peptide.Phosphorothioate nucleic acids in which the usual phosphates of thebackbone are substituted with thiophosphates can be converted into acharge-neutral DNA using simple alkylation chemistry (Gut I G, Beck S. Aprocedure for selective DNA alkylation and detection by massspectrometry. Nucleic Acids Res. Apr. 25, 1995;23(8):1367-73). Thecoupling of a charge tag to this modified DNA results in an increase insensitivity to the same level as that found for peptides. A furtheradvantage of charge tagging is the increased stability of the analysisagainst impurities which make the detection of unmodified substratesconsiderably more difficult.

[0014] Genomic DNA is obtained from DNA of cell, tissue or other testsamples using standard methods. This standard methodology is found inreferences such as Fritsch and Maniatis eds., Molecular Cloning: ALaboratory Manual, 1989.

DESCRIPTION

[0015] The object of the present invention is to provide the chemicallymodified DNA of genes associated with metabolism, as well asoligonucleotides and/or PNA-oligomers for detecting cytosinemethylations, as well as a method which is particularly suitable for thediagnosis and/or therapy of genetic and epigenetic parameters of genesassociated with metabolism. The present invention is based on thediscovery that genetic and epigenetic parameters and, in particular, thecytosine methylation pattern of genes associated with metabolism areparticularly suitable for the diagnosis and/or therapy of diseasesassociated with metabolism.

[0016] This objective is achieved according to the present inventionusing a nucleic acid containing a sequence of at least 18 bases inlength of the chemically pretreated DNA of genes associated withmetabolism according to one of Seq. ID No.1 through Seq. ID No.64 andsequences complementary thereto and/or oligonucleotide- and/or achemically pretreated DNA of genes according to the sequences of genesaccording to table 1 and sequences complementary thereto. In the table,after the listed gene designations, the respective data bank numbers(accession numbers) are specified which define the appertaining genesequences as unique. GenBank was used as the underlying data bank, whichis located at the National Institute of Health at the internet addresshttp://www.ncbi.nlm.nih.gov.

[0017] The chemically modified nucleic acid could heretofore not beconnected with the ascertainment of genetic and epigenetic parameters.

[0018] The object of the present invention is further achieved by anoligonucleotide or oligomer for detecting the cytosine methylation statein chemically pretreated DNA, containing at least one base sequencehaving a length of at least 13 nucleotides which hybridizes to achemically pretreated DNA of genes associated with metabolism accordingto Seq. ID No.1 through Seq. ID No.64 and sequences complementarythereto and/or oligonucleotide- and/or a chemically pretreated DNA ofgenes according to the sequences of genes according to table 1 andsequences complementary thereto. The oligomer probes according to thepresent invention constitute important and effective tools which, forthe first time, make it possible to ascertain the genetic and epigeneticparameters of genes associated with metabolism. The base sequence of theoligomers preferably contains at least one CpG dinucleotide. The probesmay also exist in the form of a PNA (peptide nucleic acid) which hasparticularly preferred pairing properties. Particularly preferred areoligonucleotides according to the present invention in which thecytosine of the CpG dinucleotide is the 5^(th)-9^(th) nucleotide fromthe 5′-end of the 13-mer; in the case of PNA-oligomers, it is preferredfor the cytosine of the CpG dinucleotide to be the 4^(th)-6^(th)nucleotide from the 5′-end of the 9-mer.

[0019] The oligomers according to the present invention are normallyused in so called “sets” which contain at least one oligomer for each ofthe CpG dinucleotides of the sequences of Seq. ID No.1 through Seq. IDNo.64 and sequences complementary thereto and/or oligonucleotide- and/ora chemically pretreated DNA of genes according to the sequences of genesaccording to table 1 and sequences complementary thereto. Preferred is aset which contains at least one oligomer for each of the CpGdinucleotides from one of Seq. ID No.1 through Seq. ID No.64 andsequences complementary thereto and/or oligonucleotide- and/or achemically pretreated DNA of genes according to the sequences of genesaccording to table 1 and sequences complementary thereto.

[0020] Moreover, the present invention makes available a set of at leasttwo oligonucleotides which can be used as so-called “primeroligonucleotides” for amplifying DNA sequences of one of Seq. ID No.1through Seq. ID No.64 and sequences complementary thereto and/oroligonucleotide- and/or a chemically pretreated DNA of genes accordingto the sequences of genes according to table 1 and sequencescomplementary thereto, or segments thereof.

[0021] In the case of the sets of oligonucleotides according to thepresent invention, it is preferred that at least one oligonucleotide isbound to a solid phase.

[0022] The present invention moreover relates to a set of at least 10 n(oligonucleotides and/or PNA-oligomers) used for detecting the cytosinemethylation state in chemically pretreated genomic DNA (Seq. ID No.1through Seq. ID No.64 and sequences complementary thereto and/oroligonucleotide- and/or a chemically pretreated DNA of genes accordingto the sequences of genes according to table 1 and sequencescomplementary thereto). These probes enable diagnosis and/or therapy ofgenetic and epigenetic parameters of genes associated with metabolism.The set of oligomers may also be used for detecting single nucleotidepolymorphisms (SNPs) in the chemically pretreated DNA of genesassociated with metabolism according to one of Seq. ID No.1 through Seq.ID No.64 and sequences complementary thereto and/or oligonucleotide-and/or a chemically pretreated DNA of genes according to the sequencesof genes according to table 1 and sequences complementary thereto.

[0023] According to the present invention, it is preferred that anarrangement of different oligonucleotides and/or PNA-oligomers (aso-called “array”) made available by the present invention is present ina manner that it is likewise bound to a solid phase. This array ofdifferent oligonucleotide- and/or PNA-oligomer sequences can becharacterized in that it is arranged on the solid phase in the form of arectangular or hexagonal lattice. The solid phase surface is preferablycomposed of silicon, glass, polystyrene, aluminium, steel, iron, copper,nickel, silver, or gold. However, nitrocellulose as well as plasticssuch as nylon which can exist in the form of pellets or also as resinmatrices are possible as well.

[0024] Therefore, a further subject matter of the present invention is amethod for manufacturing an array fixed to a carrier material foranalysis in connection with diseases associated with metabolism in whichmethod at least one oligomer according to the present invention iscoupled to a solid phase. Methods for manufacturing such arrays areknown, for example, from U.S. Pat. No. 5,744,305 by means of solid-phasechemistry and photolabile protecting groups.

[0025] A further subject matter of the present invention relates to aDNA chip for the analysis of diseases associated with metabolism whichcontains at least one nucleic acid according to the present invention.DNA chips are known, for example, for U.S. Pat. No. 5,837,832.

[0026] Moreover, a subject matter of the present invention is a kitwhich may be composed, for example, of a bisulfite-containing reagent, aset of primer oligonucleotides containing at least two oligonucleotideswhose sequences in each case correspond or are complementary to an 18base long segment of the base sequences specified in the appendix (Seq.ID No.1 through Seq. ID No.64 and sequences complementary thereto and/oroligonucleotide- and/or a chemically pretreated DNA of genes accordingto the sequences of genes according to table 1 and sequencescomplementary thereto), oligonucleotides and/or PNA-oligomers as well asinstructions for carrying out and evaluating the described method.However, a kit along the lines of the present invention can also containonly part of the aforementioned components.

[0027] The present invention also makes available a method forascertaining genetic and/or epigenetic parameters of genes associatedwith the cycle cell by analyzing cytosine methylations and singlenucleotide polymorphisms, including the following steps:

[0028] In the first step of the method, a genomic DNA sample ischemically treated in such a manner that cytosine bases which areunmethylated at the 5′-position are converted to uracil, thymine, oranother base which is dissimilar to cytosine in terms of hybridizationbehavior. This will be understood as ‘chemical pretreatment’hereinafter.

[0029] The genomic DNA to be analyzed is preferably obtained from usualsources of DNA such as cells or cell components, for example, celllines, biopsies, blood, sputum, stool, urine, cerebral-spinal fluid,tissue embedded in paraffin such as tissue from eyes, intestine, kidney,brain, heart, prostate, lung, breast or liver, histologic object slides,or combinations thereof.

[0030] The above described treatment of genomic DNA is preferablycarried out with bisulfite (hydrogen sulfite, disulfite) and subsequentalkaline hydrolysis which results in a conversion of non-methylatedcytosine nucleobases to uracil or to another base which is dissimilar tocytosine in terms of base pairing behavior.

[0031] Fragments of the chemically pretreated DNA are amplified, usingsets of primer oligonucleotides according to the present invention, anda, preferably heat-stable polymerase. Because of statistical andpractical considerations, preferably more than ten different fragmentshaving a length of 100-2000 base pairs are amplified. The amplificationof several DNA segments can be carried out simultaneously in one and thesame reaction vessel. Usually, the amplification is carried out by meansof a polymerase chain reaction (PCR).

[0032] In a preferred embodiment of the method, the set of primeroligonucleotides includes at least two olignonucleotides whose sequencesare each reverse complementary or identical to an at least 18 base-pairlong segment of the base sequences specified in the appendix (Seq. IDNo.1 through Seq. ID No.64 and sequences complementary thereto and/oroligonucleotide- and/or a chemically pretreated DNA of genes accordingto the sequences of genes according to table 1 and sequencescomplementary thereto). The primer oligonucleotides are preferablycharacterized in that they do not contain any CpG dinucleotides.

[0033] According to the present invention, it is preferred that at leastone primer oligonucleotide is bonded to a solid phase duringamplification. The different oligonucleotide and/or PNA-oligomersequences can be arranged on a plane solid phase in the form of arectangular or hexagonal lattice, the solid phase surface preferablybeing composed of silicon, glass, polystyrene, aluminium, steel, iron,copper, nickel, silver, or gold, it being possible for other materialssuch as nitrocellulose or plastics to be used as well.

[0034] The fragments obtained by means of the amplification can carry adirectly or indirectly detectable label. Preferred are labels in theform of fluorescence labels, radionuclides, or detachable moleculefragments having a typical mass which can be detected in a massspectrometer, it being preferred that the fragments that are producedhave a single positive or negative net charge for better detectabilityin the mass spectrometer. The detection may be carried out andvisualized by means of matrix assisted laser desorption/ionization massspectrometry (MALDI) or using electron spray mass spectrometry (ESI).

[0035] The amplificates obtained in the second step of the method aresubsequently hybridized to an array or a set of oligonucleotides and/orPNA probes. In this context, the hybridization takes place in the mannerdescribed in the following. The set of probes used during thehybridization is preferably composed of at least 10 oligonucleotides orPNA-oligomers. In the process, the amplificates serve as probes whichhybridize to oligonucleotides previously bonded to a solid phase. Thenon-hybridized fragments are subsequently removed. Said oligonucleotidescontain at least one base sequence having a length of 13 nucleotideswhich is reverse complementary or identical to a segment of the basesequences specified in the appendix, the segment containing at least oneCpG dinucleotide. The cytosine of the CpG dinucleotide is the 5^(th) to9^(th) nucleotide from the 5′-end of the 13-mer. One oligonucleotideexists for each CpG dinucleotide. Said PNA-oligomers contain at leastone base sequence having a length of 9 nucleotides which is reversecomplementary or identical to a segment of the base sequences specifiedin the appendix, the segment containing at least one CpG dinucleotide.The cytosine of the CpG dinucleotide is the 4^(th) to 6^(th) nucleotideseen from the 5′-end of the 9-mer. One oligonucleotide exists for eachCpG dinucleotide.

[0036] In the fourth step of the method, the non-hybridized amplificatesare removed.

[0037] In the final step of the method, the hybridized amplificates aredetected. In this context, it is preferred that labels attached to theamplificates are identifiable at each position of the solid phase atwhich an oligonucleotide sequence is located.

[0038] According to the present invention, it is preferred that thelabels of the amplificates are fluorescence labels, radionuclides, ordetachable molecule fragments having a typical mass which can bedetected in a mass spectrometer. The mass spectrometer is preferred forthe detection of the amplificates, fragments of the amplificates or ofprobes which are complementary to the amplificates, it being possiblefor the detection to be carried out and visualized by means of matrixassisted laser desorption/ionization mass spectrometry (MALDI) or usingelectron spray mass spectrometry (ESI).

[0039] The produced fragments may have a single positive or negative netcharge for better detectability in the mass spectrometer. Theaforementioned method is preferably used for ascertaining genetic and/orepigenetic parameters of genes associated with metabolism.

[0040] The oligomers according to the present invention or arraysthereof as well as a kit according to the present invention are intendedto be used for the diagnosis and/or therapy of diseases associated withmetabolism by analyzing methylation patterns of genes associated withmetabolism. According to the present invention, the method is preferablyused for the diagnosis and/or therapy of important genetic and/orepigenetic parameters within genes associated with metabolism.

[0041] The method according to the present invention is used, forexample, for the diagnosis and/or therapy of solid tumors and cancer

[0042] The nucleic acids according to the present invention of Seq. IDNo.1 through Seq. ID No.64 and sequences complementary thereto and/oroligonucleotide- and/or a chemically pretreated DNA of genes accordingto the sequences of genes according to table 1 and sequencescomplementary thereto can be used for the diagnosis and/or therapy ofgenetic and/or epigenetic parameters of genes associated withmetabolism.

[0043] The present invention moreover relates to a method formanufacturing a diagnostic agent and/or therapeutic agent for thediagnosis and/or therapy of diseases associated with metabolism byanalyzing methylation patterns of genes associated with metabolism, thediagnostic agent and/or therapeutic agent being characterized in that atleast one nucleic acid according to the present invention is used formanufacturing it, possibly together with suitable additives andauxiliary agents.

[0044] A further subject matter of the present invention relates to adiagnostic agent and/or therapeutic agent for diseases associated withmetabolism by analyzing methylation patterns of genes associated withmetabolism, the diagnostic agent and/or therapeutic agent containing atleast one nucleic acid according to the present invention, possiblytogether with suitable additives and auxiliary agents.

[0045] The present invention moreover relates to the diagnosis and/orprognosis of events which are disadvantageous to patients or individualsin which important genetic and/or epigenetic parameters within genesassociated with metabolism said parameters obtained by means of thepresent invention may be compared to another set of genetic and/orepigenetic parameters, the differences serving as the basis for adiagnosis and/or prognosis of events which are disadvantageous topatients or individuals.

[0046] In the context of the present invention the term “hybridization”is to be understood as a bond of an oligonucleotide to a completelycomplementary sequence along the lines of the Watson-Crick base pairingsin the sample DNA, forming a duplex structure. To be understood by“stringent hybridization conditions” are those conditions in which ahybridization is carried out at 60° C. in 2.5×SSC buffer, followed byseveral washing steps at 37° C. in a low buffer concentration, andremains stable.

[0047] The term “functional variants” denotes all DNA sequences whichare complementary to a DNA sequence, and which hybridize to thereference sequence under stringent conditions and have an activitysimilar to the corresponding polypeptide according to the presentinvention.

[0048] In the context of the present invention, “genetic parameters” aremutations and polymorphisms of genes associated with metabolism andsequences further required for their regulation. To be designated asmutations are, in particular, insertions, deletions, point mutations,inversions and polymorphisms and, particularly preferred, SNPs (singlenucleotide polymorphisms).

[0049] In the context of the present invention, “epigenetic parameters”are, in particular, cytosine methylations and further chemicalmodifications of DNA bases of genes associated with metabolism andsequences further required for their regulation. Further epigeneticparameters include, for example, the acetylation of histones which,however, cannot be directly analyzed using the described method butwhich, in turn, correlates with the DNA methylation.

[0050] In the following, the present invention will be explained ingreater detail on the basis of the sequences and examples with respectto the accompanying figure without being limited thereto.

[0051] Sequences having odd sequence numbers (e.g., Seq. ID No. 1, 3, 5,. . . ) exhibit in each case sequences of the chemically pretreatedgenomic DNAs of different genes associated with metabolism.

[0052]FIG. 1

[0053]FIG. 1 shows the hybridisation of fluorescent labelledamplificates to a surface bound olignonucleotide. Sample I being from apilocytic astrocytoma tumor sample and sample II being from anoligodenrogliome grade II tumor sample. Flourescence at a spot showshybridisation of the amplificate to the olignonucleotide. Hybridisationto a CG olignonucleotide denotes methylation at the cytosine positionbeing analysed, hybridisation to a TG olignonucleotide denotes nomethylation at the cytosine position being analysed. It can be seen thatSample I had a higher degree of methylation than Sample II at position514.

[0054] Sequence ID Nos. 1 to 64

[0055] Sequence ID Nos. 1 to 64 show sequences of the chemicallypretreated genomic DNAs of different genes associated with metabolism.In particular, sequences having odd sequence numbers (e.g., Seq. ID No.1, 3, 5, . . . ) exhibit in each case sequences of the chemicallypretreated genomic DNAs of different genes associated with metabolism.Sequences having even sequence numbers (e.g., Seq. ID No. 2, 4, 6, . . .) exhibit in each case the sequences of the chemically pretreatedgenomic DNAs of genes associated with metabolism which are complementaryto the preceeding sequences (e.g., the complementary sequence to Seq. IDNo.1 is Seq. ID No.2, the complementary sequence to Seq. ID No.3 is Seq.ID No.4, etc.).

[0056] Seq. ID No. 65 to seq. ID No. 68 show specific oligonucleotidesequences as used in Example 1.

[0057] The following example relates to a fragment of a gene associatedwith metabolism, in this case, OAT in which a specific CG-position isanalyzed for its methylation status.

EXAMPL 1 Methylation Analysis of the Gene OAT Associated withMetabolism.

[0058] The following example relates to a fragment of the gene OAT inwhich a specific CG-position is to be analyzed for methylation.

[0059] In the first step, a genomic sequence is treated using bisulfite(hydrogen sulfite, disulfite) in such a manner that all cytosines whichare not methylated at the 5-position of the base are modified in such amanner that a different base is substituted with regard to the basepairing behavior while the cytosines methylated at the 5-position remainunchanged.

[0060] If bisulfite solution is used for the reaction, then an additiontakes place at the non-methylated cytosine bases. Moreover, adenaturating reagent or solvent as well as a radical interceptor must bepresent. A subsequent alkaline hydrolysis then gives rise to theconversion of non-methylated cytosine nucleobases to uracil. Thechemically converted DNA (sequence ID 159) is then used for thedetection of methylated cytosines. In the second method step, thetreated DNA sample is diluted with water or an aqueous solution.Preferably, the DNA is subsequently desulfonated (10-30 min, 90-100° C.)at an alkaline pH value. In the third step of the method, the DNA sampleis amplified in a polymerase chain reaction, preferably using aheat-resistant DNA polymerase. In the present case, cytosines of thegene OAT are analyzed. To this end, a defined fragment having a lengthof 572 bp is amplified with the specific primer oligonucleotidesTGGAGGTGGATTTAGAGGTA (Sequence ID 65) and AACCAAAACCCCAAAACAAC (SequenceID No. 66). This amplificate serves as a sample which hybridizes to anoligonucleotide previously bonded to a solid phase, forming a duplexstructure, for example GTGTATTCGGTTGTTTTT (Sequence ID No. 67), thecytosine to be detected being located at position 514 of theamplificate. The detection of the hybridization product is based on Cy3and Cy5 fluorescently labelled primer oligonucleotides which have beenused for the amplification. A hybridization reaction of the amplifiedDNA with the oligonucleotide takes place only if a methylated cytosinewas present at this location in the bisulfite-treated DNA. Thus, themethylation status of the specific cytosine to be analyzed is inferredfrom the hybridization product.

[0061] In order to verify the methylation status of the position, asample of the amplificate is further hybridized to anotheroligonucleotide previously bonded to a solid phase. Saidolignonucleotide is identical to the oligonucleotide previously used toanalyze the methylation status of the sample, with the exception of theposition in question. At the position to be analysed saidoligonucleotide comprises a thymine base as opposed to a cytosine basei.e GTGTATTTGGTTGTTTTT (Sequence ID No. 68). Therefore, thehybridisation reaction only takes place if an unmethylated cytosine waspresent at the position to be analysed. The procedure was carried out oncell samples from 2 patients, sample I being from a pilocyticastrocytoma tumor sample and sample 11 being from an oligodenrogliomegrade II tumor sample.

[0062] From the results (FIG. 1) it can be seen that Sample I had ahigher degree of methylation than Sample II at position 514.

EXAMPLE 2 Diagnosis of Diseases Associated with Metabolism

[0063] In order to relate the methylation patterns to one of thediseases associated with metabolism, it is initially required to analyzethe DNA methylation patterns of a group of diseased and of a group ofhealthy patients. These analyses are carried out, for example,analogously to Example 1. The results obtained in this manner are storedin a database and the CpG dinucleotides which are methylated differentlybetween the two groups are identified. This can be carried out bydetermining individual CpG methylation rates as can be done, forexample, in a relatively imprecise manner, by sequencing or else, in avery precise manner, by a methylation-sensitive “primer extensionreaction”. It is also possible for the entire methylation status to beanalyzed simultaneously, and for the patterns to be compared, forexample, by clustering analyses which can be carried out, for example,by a computer.

[0064] Subsequently, it is possible to allocate the examined patients toa specific therapy group and to treat these patients selectively with anindividualized therapy.

[0065] Example 2 can be carried out, for example, for metabolicdiseases, solid tumours and cancer. TABLE 1 List of preferred genesassociated with metabolism according to the invention Genbank Entry No.Gen (http://www.ncbi.nlm.nih.gov) DUSP2 NM_004418 EPHX2 NM_001979 QDPRNM_000320 SGSH NM_000199 SHMT2 NM_005412 SLC7A2 NM_003046 SLC7A4NM_004173 TYMS NM_001071

Diagrams

[0066]FIG. 1

[0067]FIG. 1 shows the hybridisation of fluorescent labelledamplificates to a surface bound olignonucleotide. Sample I being from apilocytic astrocytoma tumor sample and sample II being from anoligodenrogliome grade II tumor sample. Flourescence at a spot showshybridisation of the amplificate to the olignonucleotide. Hybridisationto a CG olignonucleotide denotes methylation at the cytosine positionbeing analysed, hybridisation to a TG olignonucleotide denotes nomethylation at the cytosine position being analysed. It can be seen thatSample I had a higher degree of methylation than Sample II at position514.

1 68 1 6149 DNA Artificial Sequence chemically treated genomic DNA (Homosapiens) 1 gtgttgggat tataggtttg agttattata tttggttttt aagagatatattagagtttt 60 aattcgaagt atttatgaat gtgattattt ggaaatagag aatttgtaggtgtaattaaa 120 ttaagatgag gttataattg gatttggatg ggttttaaat ttaatgattagtgtttttat 180 agtaagagtg gagaaaaagt tatatatagg ggagaagata ggggttggattgatgttttt 240 ataaagttag gaatattaag gatttttaat aattattacg attttggagagaggtatgga 300 atagattttt cgttagaatt tatagaaaga attaattttg ttaatatttggattttggat 360 tttagttttt agaattgtaa gaaaatatat tttttttgtt ttaagttatttagttggtgg 420 taatttgttg ttgtaatttt aggaaataaa tatagatttt ggtattgaaaagtggggtgt 480 tgttatatta atatatataa atatggaagt gtttttatta atagattggggtgatgggta 540 gaggaagaag tttgaggtat atgatagatt aagtttagat tgttttgaagagaaagtggg 600 tggaaatgtg agtgttttat ttttataaaa aataaaaatt aggtgggtatggtgatatac 660 gtgtagtttt agttatttgg aaggttgagg taggaggatt atttgagtttaggaggttgt 720 agtgagttat gatcgtatta ttgtatttta gtttgggtga tagagtaaggttttgttttt 780 tttttttttt ttttttttgg agatagagtt ttgttttgtc gtttaggttggagtatagtg 840 gtacgatttc gatttattgt aatttttatt ttttgggttt aagcgatttttttgttttag 900 ttttttgagt agttgggttt atagaagttt attattatat ttagttaattttttgtattt 960 ttattagaga tagggtttta ttatgttagt cgggttggtt tggaatttttgattttaggt 1020 gatttgtttt ttttggtttt ttaaagtgtt agaattatag gtatgagttattatatttgg 1080 ttagagattt tgttttttaa ataaatatat tttttggaag gatattgtttaacgtagtat 1140 aacgagttat tttagtagtt taagtttgat agaagttgtt cgttgtagaagaatttattt 1200 ggaaatgaat attaaatatt tttgtattat aaatataata tttataagttttttttaaat 1260 gtttttaatt ttttattagt tttttgttgt gaaaatattg ttttaatatttttaaaatta 1320 atttttattt ttagaaagtt attttgggtt ttatggatat tttagagggttttattttat 1380 taatatttta ataatatttt gtaagattta agtttttatt tataagtttgttattagatg 1440 gaggtattga ttagattttt ttgataaatg taataaattt tagataaattattttttgag 1500 tagtttttta ttaatatatt tgtttagata ttattgtttg ttatgataggaatgataatt 1560 taaagttata aatttagata tgtaaaaaat gtttttaaat tttttttttggttaggtgtg 1620 gtggtttata tttgtaattt tagtattttg ggagattgag ggaggattgtttgggtttag 1680 gagttggaga ttagtttggg taatatagtg agaatttgtg tttattaaaatattagtatt 1740 aataataata aattttaaaa tataaataaa aataattttt ttttaattgtatttaatttt 1800 tattttaata ttttattttt attttataga agaaatgtta atttagttattttttttttt 1860 ttttttgaga cggagtttcg ttttgttatt taggttgtag tgtagtgatacgattttggt 1920 ttattgtaag tttcgttttt tgggtttacg ttattgtttt attttagttttttaggtagt 1980 tgggattata ggtggttttt tttatgttta gttaattttt tgtatttttagtagagatag 2040 ggttttatcg tgttaggatg gtttcgattt tttgattttg tgattcgtttgttttggttt 2100 tttaaagtgt tgggattata ggcgtgagtt atcgcgttcg gttaagttttagatttttaa 2160 atgaaattat tagttatatt tttgtttggt gtttatattg gtgataaagttatttttatt 2220 tttttgaagt ttagttttaa agagtagttt gtttgttgta gttttagaaataaatgtatt 2280 attttttttt ttttaatgtt tttaaatgtt tttgaatttt tttagaagttgttttgatga 2340 atatagtggt attttttttt ggtagtgttt ttgatggtag aattgtttaattatagttga 2400 tttttatgtt tttagttagg ttttttttag ggtaggtgtt ttttaagatataattagtgt 2460 agtgagtgtt tagaagttta gatttagtaa ttagattgtt tagattttaattgtaattgt 2520 gttattaatt attagttttg tgtttttgga taaatttttg gaaaatgtggataatgttat 2580 tttttaattt agtggatttt tgggagaatt aaaattaaat tgtaaaagaattggtttata 2640 ttaagaatta tgtatatagt tatgtaatta gttttttttt tttttttttttttttgagat 2700 atagttttat tttgttgttt aggttggagt gtagtggtgt gattttagtttattgtaatt 2760 tttatttttt aggtttaagt aatttttttg ttttagtttt ttgagtagttgggattatag 2820 gtgtttatta ttatgtttag ttaatttttg tatttttagt agagatggggttttgttatg 2880 ttggttaggt tgtttttaat ttttgatttt aaatgattta tttatttgggttttttaaag 2940 tgttgtgatt ataggcgtga gcgattacgt ttagtttaat tagttattttttattgtgtg 3000 atattttagt tattagtttt ggttttttat aattggtaat ttttatgaggttagattttt 3060 agttttttga gttatttttt taataattta atttttttag ttagaaatatttgttttttt 3120 tttttttttt tttttttata tatatatata tataaagttt aaatattgatatataatgta 3180 atgatttttt tttaataatt ttcgaagtag tttagtatga aaaatatttgtttttggttt 3240 ttggtagaag ggaaaggtgt gagtgtgata ttttaaggaa ggaggtaggttttggtgagt 3300 tgttgaatag agaggttttt cggtgtagga attatagggg attttaagggataaatttgg 3360 agtgatgggg aaattaaaga tagggtgtta tattaaaaaa ttattttggtcgcgtgtagt 3420 ggtttacgtt tgtaatttta gtattttggg aggtttagtg ggggcggattgcgtgagttt 3480 aggagtttga gattagtttt tgggtaatat ggtgaaaatt cgtttttattaaaatataaa 3540 agattagtta ggtttggtag cgtgcgtttg taattttagt tattcgtgaggttgaggcga 3600 atttaggagg tagaggttgt agtgagttaa gatcgcgttt gggtgataagtgcgagattg 3660 ttttaaaaaa aaaaattatt tttaaataga tttatttagg tggtttatgtttataatatt 3720 tgtgttttgg gaggttaagg ttagaagatt ttttaaggtt aggagtttgagattagtttg 3780 ggtaatatag taagattttt tttttatata aaataaaaat taaaaaaattagtatggtgg 3840 agtatgtttg tagttttagt tacgtagtta tttgggaagt agagataggaggatttttta 3900 gttatttggg aggtagagat aggaggattt tttgagatta ggagtttgaggttgtagtga 3960 gatatgattg tattattgta ttttagattg ggtgataaga gcgagattttattttaaaaa 4020 aaaaaaatat tttaaaatat aatggtttaa aataataatt tattgttttttttcgttttt 4080 gtggattatg aatttagata gtatggtggg tatggtttgt ttttgttttatgatgtttgg 4140 ggttttagtt ggagtggttg aaggttgggg attggaatta tttgaggttttttatttata 4200 tttgtatttg gattgagttt ggaatttgat tgttttaaaa tatttttacggttgggtgtg 4260 atggtttacg ttcgttattt tcgtattttg agaggttgag tttggttttttgtttgagtt 4320 tcggagttag ttattcgttt atggttatat agggagattt agtttttattaaaaaaaaaa 4380 aatataataa tttgttgggc gtggtcgttt gcgtttgtaa ttttagtattttgggaggtc 4440 gaggagggag gtttatttga gtttaggagt ttaagattag tttggttaatatggtgaaat 4500 ttcgttttta taaaaaatat aaaattattt ggttgtggag gttttcgtttgtagttttag 4560 ttattgggat ggttggggag ggaggatcgt ttgagttttg atggtcgagattatagtgag 4620 ttgtggttac gttattgtat ttagtttggg tgatagagtg agattttttttttaaaaaaa 4680 aaaaaaaatt ttaaaatatt tttatgagtt tgtgttgggt aggtttaagggaaatatgtt 4740 tagtaaatcg aaaaatttcg gattatatat aaattatcgg tttcggtaggttagatttgg 4800 tggatacggg agttagtagc gtgttaggtg ttcgttgatt ttagcgttagtgtttttatt 4860 tacgtttttt attcgttaat tttttttggt ttaggttgcg gtgttttagcgttaggtttc 4920 gtttcgtttt tggttgtcgg ttaatcgtcg tcgattgaga ggcgattattggaggaagcg 4980 ggatgggcgg tgttcgcgtc gggtcgttag gggtgcgggg ttggggaggaggtcgttagt 5040 ttacgtttgt ggagtcgata tttagttttt tgcgattatg gttgtgttggcggtattttt 5100 gcgtagcggc gttcgtagtc gtagtttttt gtttcggagg ttggtgtaggtgagcggggt 5160 tcgtttttat agtatttaga ttcgggatgc gaggagtttt cgtttcggaagtttttagtt 5220 cgcggtcgtt gcggttttcg cggttcgggc gcgcggttta ggttttaggatagttacgcg 5280 acgggttttg gtttaaaaat cgtttaagtg tttcgataat atttaggattcgtttatttt 5340 tatagcgcgt ttttattttt aaggtttcgg cgtaattatt ttaatgagcgttattggtgt 5400 gttaaataag ggtacgtgtt tgggcgggta ggatcgttag gattggcgttggttcggttt 5460 gagcggtggg atcggggaga gtttttttgt aggtttgtgt agttgttttcgagatttttt 5520 ttaaaatata tttgtgtgcg ttattgttag gagaggtttt tttttttttttaatataata 5580 gataattatt gggtatataa ggggagaggg tattatgtga ttataatagatgttttttgg 5640 agtagtttga aatttattag ggaaaataaa tgattattta gataatataataaattatat 5700 ttgatatatg agtaaagttt atatattgag ggcgttttaa gggttgtcgtttttttgatc 5760 gttgtgttta gggaatatag taggggtaga gttttaaaga atttattttttatatgcgta 5820 agtaagggag tacgtattat agattgttag gtaaagtttt aggaataggtagagattttt 5880 agggtgtggt tggtgaagtt tgagtttttt aggtcgatgg gggtaataagtttggagatt 5940 tagttatgtt gtgagtatgg atttgatttt agttaagtag ggattgttgatatgtttgtt 6000 tttgttgtaa tggtaggtta ttttagtttt tacgtttggg cgtagaataatattatttgt 6060 ataagggtgt tggcggtagg agttttgtaa gagattgtaa aagaattagtttaggatttg 6120 ataattaggg agtgagggtg cgaagttaa 6149 2 6149 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 2ttggtttcgt atttttattt tttaattgtt aagttttaga ttggtttttt tataattttt 60tgtaaagttt ttatcgttag tatttttgtg taagtaatgt tattttacgt ttagacgtaa 120gaattagagt gatttattat tgtaataaaa ataaatatat taataatttt tatttaatta 180gggttaagtt tatatttata atataattgg atttttaagt ttattgtttt tatcgattta 240gaaaatttaa gttttattaa ttatattttg aaggttttta tttatttttg aggttttgtt 300tgataatttg tggtgcgtat ttttttgttt acgtatgtgg agaataaatt ttttgagatt 360ttgtttttgt tgtgtttttt aaatataacg gttagaagag cgatagtttt tggaacgttt 420ttagtatgtg agttttgttt atatgttaag tataatttat tgtattattt gagtagttat 480ttgttttttt tgataaattt taggttgttt taaaaaatat ttgttatgat tatatggtgt 540tttttttttt tgtatgttta atgattattt attgtattaa aaaagaaaag gaattttttt 600tgataataac gtatataaat atgttttaaa gaaaatttcg ggagtagttg tataggtttg 660taaagagatt tttttcgatt ttatcgttta ggtcgggtta gcgttaattt tggcggtttt 720gttcgtttag atacgtgttt ttgtttgata tattagtaac gtttattaag atgattacgt 780cgagattttg gaagtagaaa cgcgttgtaa aaataggcga gttttgggtg ttatcggagt 840atttaggcgg tttttggatt agaattcgtc gcgtgattgt tttggggttt aagtcgcgcg 900ttcgggtcgc gggagtcgta acggtcgcgg gttggaagtt ttcgaggcgg ggatttttcg 960tatttcgggt ttgagtgttg tggggacgaa tttcgtttat ttgtattagt tttcggagta 1020gggggttgcg gttgcgggcg tcgttgcgta gaagtgtcgt tagtatagtt atggtcgtag 1080agggttgagt atcggtttta taggcgtaga ttagcggttt tttttttaat ttcgtatttt 1140tagcggttcg gcgcgggtat cgtttatttc gtttttttta atagtcgttt tttagtcggc 1200ggcgattggt cggtagttaa gggcggggcg gagtttggcg ttgggatatc gtagtttggg 1260ttaggaaagg ttgacgagtg aaggacgtgg atggagatat tggcgttggg gttaacgagt 1320atttgatacg ttgttggttt tcgtgtttat taagtttaat ttgtcggggt cggtggttta 1380tgtgtaattc gagatttttc gatttattga gtatgttttt tttaggttta tttagtataa 1440atttatgaaa atattttagg attttttttt ttttttggaa aaagggtttt attttgttat 1500ttaagttgag tgtagtgacg tgattatagt ttattgtaat ttcgattatt agggtttaag 1560cgattttttt tttttagtta ttttagtagt tgagattata ggcgaaagtt tttataatta 1620gataattttg tattttttgt ggagacgggg ttttattatg ttggttagat tggttttgaa 1680tttttggatt taagtgagtt ttttttttcg gttttttaaa gtgttgggat tataggcgta 1740ggcgattacg tttagtaaat tgttgtattt tttttttttg gtagagatta ggttttttta 1800tgtggttata ggcgggtggt tgatttcggg gtttaagtag agggttagat ttagtttttt 1860aaagtgcggg gataacgggc gtgagttatt atatttagtc gtgaaaatat tttgaagtaa 1920ttaaatttta ggtttagttt agatataaat atgggtaaaa ggttttaggt gattttagtt 1980tttaattttt aattatttta gttgagattt tagatattat ggagtagaga taagttatat 2040ttattatgtt gtttgaattt atggtttata gaaacgagag aaaataatgg gttgttattt 2100taggttatta tgttttggag tatttttttt ttttaagata gggtttcgtt tttgttattt 2160agtttggagt atagtggtgt aattatattt tattgtagtt ttaaattttt ggttttaggg 2220gatttttttg tttttgtttt ttaagtagtt aggggatttt tttgtttttg ttttttaagt 2280agttacgtag ttaggattat aggtatgttt tattatgtta atttttttaa tttttatttt 2340atatagagaa ggggttttgt tatgttgttt aggttggttt taaatttttg gttttaagag 2400attttttggt tttggttttt taaagtatag atattatagg tataagttat ttaaataggt 2460ttgtttgggg gtaatttttt tttttgagat agtttcgtat ttgttattta ggcgcgattt 2520tgatttattg taatttttgt tttttgagtt cgttttagtt ttacgagtag ttgggattat 2580aggcgtacgt tgttaagttt ggttaatttt ttgtatttta gtagagacgg gtttttatta 2640tgttgtttag aggttggttt taaatttttg agtttacgta attcgttttt attaggtttt 2700ttaaagtatt gggattatag gcgtgagtta ttgtacgcgg ttagggtaat tttttaatat 2760agtattttgt ttttaatttt tttattattt taggtttgtt ttttaaagtt ttttgtgatt 2820tttgtatcga agaatttttt tatttaatag tttattaagg tttatttttt tttttggaat 2880gttatattta tatttttttt ttttattaga ggttaaagat aaatattttt tatattgggt 2940tgtttcgaga attattgaaa ggaagttatt atattgtatg ttagtgttta aattttgtgt 3000gtgtgtgtgt gtgagagaga gagagagaga gagaaataga tatttttaat tgaaaaagtt 3060gaattgttaa agaaatgatt tagaaaatta aaggtttggt tttatagaga ttattagttg 3120tgagaggtta aagttgatga ttagggtatt atatagtaaa agatgattgg ttaggttggg 3180cgtggtcgtt tacgtttgta attatagtat tttgggaggt ttaggtgagt ggattatttg 3240aagttaggag ttaaaagtag tttggttaat atagtaaaat tttattttta ttaaaaatat 3300aaaaattagt tgggtatggt agtgggtatt tgtgatttta gttatttagg aggttgaggt 3360aggagaattg tttaaatttg ggaggtggag gttgtagtga attgagatta tattattgta 3420ttttagtttg ggtaatagaa tgagattgtg ttttaaaaaa agaagaaaaa aaaaaagatt 3480ggttatatag ttatgtatat agtttttaat atgaattagt ttttttatag tttaatttta 3540atttttttaa aaatttattg aattagggag tagtattatt tatatttttt agaagtttgt 3600ttaagggtat aaagttagta gttagtgata tagttgtaat tggaatttag gtagtttggt 3660tgttaggttt aggtttttag gtatttatta tattagttgt gttttaggag atatttgttt 3720taggagaaat ttaattagga atatagaagt tagttgtaat tggataattt tgttattaga 3780ggtattatta ggaaaaagtg ttattatgtt tattaggata gtttttagag aagtttagag 3840atatttagga gtattgaggg gagaagaata gtatatttat ttttggagtt atagtaggta 3900agttgttttt taaaattaaa ttttaaaaaa ataagagtag ttttattatt aatatgagta 3960ttaggtaaaa atgtagttaa taattttatt taagaattta ggatttggtc gggcgcggtg 4020gtttacgttt gtaattttag tattttagga ggttaaggta ggcggattat aaggttagga 4080gatcgagatt attttaatac ggtgaaattt tgtttttatt aaaaatataa aaaattagtt 4140gggtatggag ggggttattt gtagttttag ttatttggga ggttgaggta ggatagtggc 4200gtgaatttag gaagcggagt ttgtagtgag ttaagatcgt gttattgtat tatagtttgg 4260gtgatagagc gagatttcgt tttaaaaaaa aaaaagaaag tgattagatt aatatttttt 4320ttgtgaaata gaaatggagt gttggaatga aaattaaata taattaagag agaattattt 4380ttgtttgtat tttaaaattt attattatta gtattagtat tttggtagat ataggttttt 4440attatgttgt ttaggttggt ttttaatttt tgggtttaag taattttttt ttagtttttt 4500aaagtgttgg gattataggt gtgagttatt atatttggtt aaagaaaaaa tttaaaaata 4560ttttttgtat atttgaattt gtggttttgg attattattt ttgttatagt aggtaatagt 4620gtttggatag atgtattaat gaagagttat ttaaaaagtg gtttatttgg gatttattat 4680atttgttaag gagatttagt taatattttt atttagtggt aaatttgtaa gtggagattt 4740aggttttgta aagtattatt aaaatattga taaaataaag ttttttgaaa tgtttatgag 4800atttagagtg gttttttaga agtagaagtt agttttagga atattagagt aatattttta 4860tagtaggaaa ttagtggaaa attaaaaata tttaagaaaa atttgtgggt attatattta 4920taatataaag atgtttgata tttattttta agtaagtttt tttataacga ataatttttg 4980ttaaatttag attattggaa taattcgttg tattacgtta aatagtgttt ttttaaaaga 5040tatgtttgtt taagggatag ggtttttggt taggtgtggt ggtttatgtt tgtaatttta 5100gtattttggg aggttaagga gggtagatta tttgaggtta ggagttttag attagttcgg 5160ttaatatggt gaaattttgt ttttagtaaa aatataaaaa attagttggg tgtggtgatg 5220ggtttttgta agtttagtta tttaggaggt tgaggtaaga gaatcgtttg aatttaggag 5280gtggaggttg tagtgagtcg agatcgtgtt attgtatttt agtttgggcg atagagtaaa 5340attttgtttt taaaaaaaaa aaaaaagaga gagatagagt tttgttttgt tatttaggtt 5400ggagtgtagt ggtgcgatta taatttattg tagtttttta agtttaagta atttttttgt 5460tttagttttt taagtagtta agattatacg tgtgttatta tgtttattta atttttattt 5520tttgtagaga tggggtattt atatttttat ttattttttt tttaaggtaa tttaggttta 5580gtttattatg tgttttaaat tttttttttt gtttattatt ttaatttatt aataaaggta 5640tttttatgtt tgtgtatatt aatatggtag tattttattt tttagtatta aaatttgtat 5700ttgtttttta agattgtagt agtaaattat tattaattgg gtggtttaaa ataaaagaaa 5760tgtatttttt tatagttttg gaggttggag tttaagattt aggtgttggt aggattggtt 5820ttttttgtgg gttttaacgg agagtttgtt ttatgttttt ttttaagatc gtggtggttg 5880ttggaaattt ttggtatttt tggttttgta gaggtattag tttaattttt gttttttttt 5940ttgtgtgtgg tttttttttt atttttgtta taaggatatt ggttattgga tttagggttt 6000atttaaattt aattatgatt ttattttaat ttgattatat ttgtaagttt tttattttta 6060aatagttata tttataggta tttcgagtta agattttaat atatttttta ggggttaggt 6120gtggtggttt aggtttgtaa ttttagtat 6149 3 5770 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 3 ttttatttta aattgatacgcgttaggcgt taagttttgc gataagtttt taggatatag 60 aagtgaataa gagttttatttttattttga gaaatttgaa gttgtggaga aaatagattt 120 agaagtagat taaattagtaagtattagaa agagggagga gtagagggag tgatcgattt 180 ggtttgggat tttaaaaaaaggtatcgtta tatcgaatta tagagaataa ggggattttt 240 ttagatagaa ggtataagagaaatatttga ggaattagga attgagaatt ataatttata 300 taaatcggat tatttttttgtgggaagaaa tttttaggta ggaagtgaag ggaataaaat 360 aaatatatat tattatgattggtattcgta cgggcggtta ttttattgtt tttttatatg 420 ttcgaaaatt gattgcgataatttgataat ttaagtaagt tagaataaag gatttagaaa 480 aaaaagaatt tgaagtacgagtttttgttt taggaaatgt tttttagatg ggtaagagaa 540 aggagaatta tattagtgtatttaaattgg tatatgataa taattgattt ttggtagatt 600 gaggttgttt gtgtagtattgcgtatgtaa gttaaatatt ttatttaaat gtatcgtata 660 aggtaaatgg aaagagtgtttttttatggt ttttatttgt acgggttatg ttacgggtta 720 tgttagtatt taatgtaggttttaagtcgg ttttagttta ggttgttgga ggttagagtt 780 aaggttagtt ttttagacggcgggatttgt gtagatgtat agggattata tatagaagat 840 ttttattttg tttaatgttttattggtatt atttgtaaat ttttaataat tttatttttg 900 aatttgtgtt ttggatttgaagtttaatac gatatagaat atgtgaatga gtagaggaga 960 taggtataat gtttatgtttgtagttttta gatgttatat gtataatatt ggcgatgttt 1020 aggagtatag aatttttgtagtttatgatg agtggtattc ggtgatattt aaattaagta 1080 tacggtaagt atatgttatatttgtgttag agtaataggg tatcgatagt tttaggagtt 1140 atattttgta ttttaattagaatttttttt taaagtaatg aaaggaatat aaaagattaa 1200 ggaattttat tatgttcgttatgattcgtg ttattttgtt ttaattagtt agttatatag 1260 aaaatagtga ggtagaaggaaaagtaaaga gagggtttta tattattttt tgtttttttt 1320 attttttttt atttattagtaagttaaagg tagagagtgt tatagaatgt gtatatatta 1380 ggaggaaata aaaataggtgagttagtgtt gtacggtgtt tttatttttt tggtaggaat 1440 aaaatatttt tgtacgatttgtaaattatg tattgtgtta ttattagtga gtttttatat 1500 gagttaaatg tttttatatttgtattgaaa attagtatta cggtaaggcg ttgtggttta 1560 tatttgtaat tttagtatttgggaaggttg aggtgggcgg attatttgag gttaggggtt 1620 cgagataagt ttggtttatatggtgaaatt ttatttttat taaaaatata aaagttagtt 1680 gggtgtggtg gtatacgttcgtagttttag ttatttggga ggttgaggta ggagaatcgt 1740 ttgaatttgg gaggtagaggttgtagtgag tcgagatcgt gttattgtat tttagttttt 1800 ttagtttggg cgatagagtaagattttatt ttaaaaaaaa aaaaaaaaaa agaaaagaaa 1860 agaaaagaaa attattattgtataatataa agatgaatgt taaaattaat gttagtaatt 1920 taaattttaa attattttttttttagaatg gtattaaata gtaaataaaa atattgtgaa 1980 aagttaagag aggttgtgaaaatatagtaa aggtttatat tttagtattt ttaatggttt 2040 tttttttttg ttttttgaataagggatatt atatttttat tttgtattgt gttttgtaaa 2100 ttatgtatat agtttttgtgtgaatttatg gtttttaata tatataaata tagaaataaa 2160 tgtagttgta tttgtttgatatatgtatat atgtatatat atgtatattt atatatatat 2220 ttatgtatgt atatatatgtatatttatat atgtatgtat gtatatatat gtatatttat 2280 atatgtatgt atgtatatatatgtatattt atatatgtat gtatgtatat atatgtatat 2340 ttatatatgt atgtatgtatatatatgtat atttatatat gtatgtatgt atatatttgt 2400 atatttatat atgtatgtatatatatgtat atttatatat gtatgtatat atatgtatat 2460 ttatatatgt atgtatattattgtatttta gtttgggtga tagagcgaga tttcgtttta 2520 aaaaaaaaaa aaaaattttttttttttttt ttatttatta tttttagttt ttgtttgttt 2580 tatatgagta gataattatatgagtagtta taatgaggat tttttagggg atagattttg 2640 tttggttatt tagtagaagtatgtaattat ttttttaaga ttggttttta aatttatttt 2700 agatagagtt tttaggtaggaaattttata ttttttggtt ttagaagaat atatttatat 2760 ttatttaaat gtgttaggtattggttataa agaatattgg tgtttattta taattgttta 2820 taatgtgtta ggagttgtgtataaagtagt gtaataggat tattttggaa agtttatgta 2880 gttagtagag gagatagataaattaggaat tatatggtaa gttgaaagag gaagttaggg 2940 gtaagatgtt gtattaaatgtaggagattg gaaggttttt ttggaagaag tgatgtttag 3000 ggggagtttt agaggtaaatttttggtttg gttaatagaa gatagtttta ttgtttattg 3060 agattataga agaaataggttggaagagtt tggttttaat atgttaaatt tgatgtgttt 3120 ataggaaatt ttatttatttgagatagttt ttttttgtcg tttaggttgg agtgtagtgg 3180 tgtgatttcg gtttattgaaatttttgttt tttaggttta agcgattttt ttatgttagt 3240 ttttttagta gttgggattataggcgtacg gtattacgtt cggttaattt ttttatttta 3300 tggtagaaac gggatattattatgttggtt aggttggtgt taaattgttg attttaaatg 3360 attcgttttt ttcggttttttaaagtgttg ggattatagg tgtgagttaa ggtgttcgat 3420 ttgatgtgtt tgtaagaatttaaatgaaga gggttagtta gtttaggaga cgaggttaga 3480 tgtaaggatt ttagatttgttagtatatag gtggtgattg atgtcgtagg aatgattggt 3540 attatttagg gagttggtgtaaagtaggag ttttggggaa tatgttaagg ggatgtgaga 3600 gtaagtttat aaagatttagaagtggttag ggagtaaggg gaaaatggga tagaatagag 3660 taaaagttac gggaggtattttttgaattt tttggattta gatatgttag gggataggaa 3720 atatattgaa gataattgaagagattttag tgtgttgttg agtttttagt agagtagata 3780 gttgatttta ttattattttagattttaaa gatttttttt gaaattgtat tgttatgtaa 3840 tttttttttt tttttattgttttatttttg gggtttatat tttttatttt ttttgattta 3900 tttgatttat tcgtatatttttgtaaagtt ttaatgtagg tttttaggat ttaatgattt 3960 ttttaattaa ttttaaagttttttaggaag attttttagg ttcgttaata gttttttttt 4020 ttatgatttt gtgataaagtttttttgttt tattatttag gtgtttttaa taagttgttg 4080 taacggtggt tttttataagtttgtttgga aattttagaa agtttagaaa aattatgaat 4140 tttgtttagt aagaggttgggaagttagaa agggttttaa ataaaattga ttttatttgt 4200 tatatgtttt ttttattgtttaaacgttaa ttaaaggaat ttttgtgacg ttaagacgtt 4260 ttcggcgttt ttattcgtttatagttagag ttgattttag aaggtagggg gttcgtatcg 4320 agacgttttt agtaagttttttacgcgagc gaatgattgg cgttaggaga aacgtatagg 4380 atttttcgaa gtcgtcgagagtaaaaggat ttattagagt tgtgttgaga ttcgtcgcgg 4440 gtcgggttcg tattcgagattttcgttcgt gggattttag ttttgagttg aacgagagat 4500 aagtttttgt tattttttagtttttattgt ttcgagaaat tttaagattt tttaaaaaaa 4560 agtttaagac gttaagtcggggaattttaa tattggggtg tttagaaata ttggggtttt 4620 aggcgttttg taaatgcgttcgaggttcgc ggttttgttc gtaagtttag atttcggttt 4680 tattttcgtt tcgcgtttcgcgtttcggtt ttattttcgt ttcgcgtttc gcgtttcgcg 4740 tttcgcgcgt tttcgttcgtttttgtttcg gttttgcgtt tgcgtatagt gggatgcgcg 4800 gggaggtggt gcgcggggaggtggagggcg aggggcgggg ttattttagg tttcgttcgc 4860 ggtaggtttg tgggttgcgaggaggagttt tgtttagttt gtaggtagcg tagggtagac 4920 ggcggtagga gaagtaagatgaatgtaggt ttagattttg tggttatcgt ttcggcggcg 4980 cggattatta taggtgagtggtcggcggga gtcgcgtaga gttcgaggcg tttgttgttt 5040 cggtaggagc gtcgagggtcggatttgtgt aggagagggg cgtatgtgga ggaagtcggt 5100 taggttaagt cgcgaggagtcgcgggattt ttggaatttt gcggttttcg cgttttttga 5160 tttggtgtta tagttttatttttttttttt tcgatgtgcg tatttcgttt ttcgtgtttg 5220 gattggtttt cggggtagagttatcgcgtg gtttgttttt tttattggtt ggcgtaggga 5280 ggtgtttttt ttcggggtttttgattggtc ggtttcggga ggcgttatcg gtaatgtttg 5340 cggtaggggc ggaattgttaggtggtttga gttcggtttt gggttggggt cgggttgtta 5400 tataatggtt agaagtcgtgatttcgtttt tttcgtgtcg tatggttttt aacgtttttg 5460 attcgtcggt tttttttgtttgggaagtat ggggtcgtat ttagtttttc ggatttgggg 5520 aaatagaagg gttatagcggcgtttttagg tcgttttgga ggtcgtttgt ttagttttcg 5580 gttgttgcga gttgtggtatttattttgat ttttgtttag attagtaggt gtaggaacgt 5640 gtgggaggag agggtattgttttttcgcgt ggttttgtta aatagggtta tgaggttttt 5700 ttgttcgtag gtggttttcgtattattcgt aggtttgtga tgtttacgtt tttcgttttt 5760 ttattgtagg 5770 4 5770DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 4tttataatag aaaggcggag agcgtggata ttataagttt gcgggtaata cgggaattat 60ttacgagtag gggagtttta tgattttgtt tggtaaggtt acgcgaggag gtagtgtttt 120ttttttttat acgtttttat atttgttggt ttgagtaaag gttaaggtgg gtgttataat 180tcgtagtagt cgagggttgg ataggcgatt tttagaacgg tttagggacg tcgttgtagt 240ttttttattt ttttaaattc gaaggattgg atgcgatttt atgtttttta aataaaagga 300atcggcgggt taagggcgtt gaaaattatg cggtacgaag gagacgaagt tacgattttt 360agttattgtg tgatagttcg attttagttt aaagtcgggt ttagattatt tagtagtttc 420gtttttgtcg taggtattat cgatggcgtt tttcggagtc ggttaattag gggtttcgga 480ggagaatatt tttttacgtt aattaatggg agaggtaggt tacgcgatgg ttttatttcg 540ggagttaatt taagtacgag ggacggagtg cgtatatcgg gagaggagag ggtggggttg 600tagtattagg ttagggaacg cgggagtcgt agggttttag ggatttcgcg gtttttcgcg 660gtttggtttg atcggttttt tttatatacg tttttttttt atataagttc ggttttcggc 720gtttttgtcg aagtagtagg cgtttcggat tttgcgcggt tttcgtcggt tatttattta 780tgatggttcg cgtcgtcgag acgatgatta taggatttga gtttgtattt attttgtttt 840ttttgtcgtc gtttgttttg cgttgtttgt aagttaggta aagttttttt tcgtagttta 900taggtttgtc gcgggcggga tttgaggtag tttcgttttt cgttttttat tttttcgcgt 960attatttttt cgcgtatttt attgtgcgta ggcgtaaggt cggagtaggg gcgggcggag 1020gcgcgcgggg cgcggggcgc ggggcgcggg gcggaagtga ggtcggggcg cggggcgcgg 1080ggcggaagtg aggtcggggt ttgggtttgc gggtagaatc gcggatttcg gacgtattta 1140tagagcgttt gaaattttag tgtttttgga tattttaatg ttggagtttt tcgatttgac 1200gttttgggtt tttttttaaa aaattttagg gtttttcgaa atagtaaaga ttggggggtg 1260ataaagattt atttttcgtt tagtttagga ttggaatttt acgggcgaga atttcgagtg 1320cgagttcggt tcgcggcggg ttttagtata gttttgatgg gtttttttgt tttcggcggt 1380ttcgggaggt tttatgcgtt ttttttggcg ttagttattc gttcgcgtga ggggtttgtt 1440aggagcgttt cggtgcgagt tttttgtttt ttaagattaa ttttggttgt gaacgggtga 1500ggacgtcggg agcgttttag cgttataaaa gtttttttgg ttgacgtttg gatagtgaaa 1560ggagtatgta ataagtgggg ttagttttgt ttaaaatttt ttttgatttt ttagtttttt 1620attgggtaaa gtttataatt tttttgagtt ttttagggtt tttaggtaag tttatgaggg 1680gttatcgtta tagtaatttg ttgggaatat ttggatagtg gaataagaaa gttttgttat 1740aaagttatga aggggaaaat tgttgacgga tttggagaat ttttttgaag aattttaaag 1800ttgattgaaa gaattattaa attttggaaa tttatattaa gattttgtag agatatgcgg 1860atgggttaga taaattagag aaggtaaaga gtgtaggttt tagaggtggg gtaatagaga 1920aggaaaaaaa ttgtataata gtgtaatttt aggagaaatt tttagggttt ggaatagtgg 1980tgaaattagt tgtttatttt gttaagaatt tagtagtata ttgaagtttt tttagttgtt 2040tttaatgtgt tttttgtttt ttaatatatt tgagtttaag gaatttaagg aatgtttttc 2100gtggtttttg ttttatttta ttttattttt tttttatttt ttggttattt ttgagttttt 2160gtgggtttat ttttatattt ttttaatatg ttttttaagg tttttatttt gtattagttt 2220tttgggtaat attagttatt tttacggtat taattattat ttgtatattg ataagtttga 2280aatttttata tttaatttcg ttttttaagt tgattgattt tttttattta aatttttata 2340agtatattag gtcgggtatt ttggtttata tttgtaattt tagtattttg ggaggtcgag 2400gagggcggat tatttgaggt tagtagtttg atattagttt ggttaatatg gtgatatttc 2460gtttttatta taaaatagaa aaattagtcg ggcgtggtgt cgtgcgtttg taattttagt 2520tattggggag gttgatatgg gaaaatcgtt tgaatttagg aggtagaggt tttagtgagt 2580cgagattata ttattgtatt ttagtttgag cgatagagag aaattgtttt aaataaataa 2640aattttttat aagtatatta aatttgatat attgaaatta aattttttta gtttgttttt 2700tttgtaattt tagtgagtag tgaaattatt ttttgttaat taaattagaa atttattttt 2760gaaatttttt ttaaatatta ttttttttag aaaaattttt taattttttg tatttggtgt 2820agtattttat ttttaatttt tttttttaat ttattatgta atttttagtt tatttgtttt 2880ttttattgat tatataagtt ttttaagatg attttgttat attgttttat gtatagtttt 2940tagtatatta taggtagtta tgaatgaata ttaatatttt ttatggttag tgtttagtat 3000atttgaatga gtatgaatat atttttttgg agttaaggga tatagagttt tttgtttgaa 3060ggttttattt agagtaagtt taggagttaa ttttgagaag gtaattgtat gtttttgttg 3120agtggttaaa tagaatttgt tttttgagga gtttttatta tagttattta tatgattatt 3180tatttatatg agatagatag agattaagaa taatgaatga aggaaagaag aggaattttt 3240tttttttttt tgagacggag tttcgttttg ttatttaggt tggagtgtag tggtatatat 3300atatgtatag atatatatat gtatatatat atgtatagat atatatatgt atatatatat 3360gtatagatat ataggtgtat atatatatat atgtatagat atatatatgt atatatatat 3420atatgtatag atatatatat gtatatatat atatatgtat agatatatat atgtatatat 3480atatatatgt atagatatat atatgtatat atatatatat gtatagatat atatatgtat 3540atatatatag atatatgtat agatatatat atgtatatat atatatatat attagataaa 3600tatagttata tttattttta tatttatata tattgaaaat tatgaattta tataagagtt 3660gtgtatataa tttgtaaggt atagtgtaaa atgaaaatgt ggtgtttttt gtttaaaaag 3720tagaaaaaaa gggttattaa aggtattgaa atatagattt ttgttgtatt tttatagttt 3780tttttagttt tttatagtat ttttgtttgt tatttagtgt tattttaagg aaagaataat 3840ttaaaattta aattattagt attaatttta atatttattt ttatgttgtg tagtgatagt 3900tttttttttt tttttttttt tttttttttt ttttttttga gatggagttt tgttttgtcg 3960tttaggttgg agaggttgga gtgtagtggt acgatttcgg tttattgtaa tttttgtttt 4020ttaggtttaa acgatttttt tgttttaatt ttttaagtag ttgggattac gggcgtgtgt 4080tattatattt agttaatttt tgtattttta gtagagatgg ggttttatta tgtaggttag 4140gtttatttcg aatttttgat tttaggtgat tcgtttattt tagttttttt aagtgttggg 4200attataggtg tgagttatag cgttttgtcg taatgttagt ttttaatgta aatataagag 4260tatttaattt atatggggat ttattgataa tgatataatg tataatttgt agatcgtata 4320ggagtatttt gtttttatta gaaaggtgga aatatcgtat agtattaatt tatttgtttt 4380tatttttttt tgatgtatgt atattttatg atattttttg tttttggttt attgatgagt 4440aagggaggat ggaaaggata aggaatgatg tggagttttt tttttgtttt tttttttatt 4500ttattatttt ttgtgtagtt ggttggttaa aataaaataa tacgagttat aacgaatatg 4560atagggtttt ttggtttttt gtgttttttt tattattttg gaaaaaggtt ttagttgaaa 4620tgtagagtgt ggtttttgga gttgtcggtg ttttgttatt ttgatataaa tgtggtatgt 4680atttgtcgtg tatttggttt gggtgttatc gaatgttatt tattatgggt tataggaatt 4740ttgtgttttt gggtatcgtt aatgttatgt atgtgatatt tgggaattgt agatatgggt 4800attgtgtttg ttttttttgt ttatttatat gttttgtgtc gtgttggatt ttaagtttaa 4860aatataagtt taaagataaa attattaagg atttgtagat ggtgttagta gagtattaaa 4920taaagtaagg attttttgtg tatggttttt gtgtatttgt ataggtttcg tcgtttaaga 4980agttggtttt ggttttggtt tttaataatt tggattaaaa tcggtttgaa atttgtatta 5040gatgttgata tgattcgtga tatgattcgt gtaagtggga attatggaaa aatatttttt 5100ttatttgttt tgtacgatat atttgagtag agtatttagt ttatatacgt agtattgtat 5160aggtagtttt aatttgttag ggattagttg ttattatatg ttaatttgaa tgtattggta 5220tagttttttt tttttttatt tatttagaaa atatttttta aggtaagaat tcgtgtttta 5280agtttttttt tttttgaatt ttttgttttg atttatttag gttattaggt tgtcgtagtt 5340agttttcgga tatgtgaagg ggtagtaggg taatcgttcg tgcgaatgtt aattatgatg 5400gtgtgtattt attttatttt ttttattttt tgtttgggag ttttttttta taagaaggta 5460attcgatttg tgtaagttat aatttttaat ttttgatttt ttaaatgttt tttttgtgtt 5520ttttgtttgg gaaaattttt ttattttttg tgattcggtg taacggtgtt tttttttgag 5580gttttaggtt aaatcgatta ttttttttgt tttttttttt ttttggtatt tgttggttta 5640atttgttttt aggtttgttt tttttataat tttaagtttt ttagggtggg aatggggttt 5700ttatttattt ttgtgttttg aaagtttatc gtagggtttg gcgtttagcg cgtgttaatt 5760taaaatgggg 5770 5 6032 DNA Artificial Sequence chemically treatedgenomic DNA (Homo sapiens) 5 tgggtatggt ggtttatatt tgtggtttta gttatttaggaggttgatat gagaggatcg 60 tttgagttcg taagattaag gttgtagtga gttatgattatattattgta tttaatttgg 120 gtgatagagt gagattttgt tttaaaaaag aaaaaagaaaatatggtata tatatatggt 180 agaatattat ttatttttaa atagaattgt tgtttttaatattatggatg gaatggaggt 240 tattatgtta agtgaagtaa gttaagtaga gagagataaattttgtatgt ttttatttat 300 ttgagggaat taaaaaattt aaaaattgaa tttatggagatagagagtag aataatggtt 360 gttagaattt gggaagggta gttggggatg agtaagaagtggggttggtt aatgggtatg 420 aaaatataat taaatagaat gaataagatt tagtatttggtagtataata gggtgattat 480 agttaataat aatttattgt atattttaaa ataattaaaggaatataatt ggattgtttg 540 taatacgaaa gaagaaatgt ttgaggtgat gaatattttatttattttga tgtgattatt 600 atggattgta tgtttgtatt aaaatatttt atgtattttatgaatatata tatttagtat 660 gtatttataa aaattaaaat gaaaaaagga aaatatagataaattggatt ttataaaaat 720 ttaaaatttg tatattaatg agtattttta atagagattagaaaaagtaa atatataggt 780 ggggtgtagt ggtttatgtt tgtaatttta gtattttgggaggttaagat gggagaattg 840 tttgaggata agagtttaag attagtttgg gtagtataaagaggcgttat tgttatagaa 900 aaattaaaaa ttagttaggt atggtggtag gtgtttttagttttaattat ttaggaagtt 960 gaggtatgag gatgaggatt atttgaggtt aagaggttgaggttgtaatg agttatgatt 1020 atgttagtgt attttagttt ggttaataga gtgagattttatttttaaaa aaaaaaaana 1080 aaanaaaaan nnnaaaaggt aatatataga atggatgtgagaaaatattt gtaaattatt 1140 tatttaatta gggatttaga atgtatagaa tttttaaaatttaataataa aaaaataaat 1200 aattttattt aaaaaggggt aaaagagttg aatagatatttatataaaag tatatatgaa 1260 gggttaataa ttatatgaaa agatgtttaa tattattaattattagaaaa atgtaaatta 1320 aaattataat aagatattat tttaaattta ttaggatgattattaataaa aaattagaaa 1380 ataataattg ttagtaagga tgtgttgaaa ttgaaatttttgtgtattgt tagtggtaat 1440 ataaaatagt atagttattg taaaaaatag tatggtagttatttaaaaaa ttaaaaatag 1500 gacgggtgtt gttattttag tattttggaa gattaaggtcggtgtattat ttgaggttaa 1560 gagttcgaga ttagtttgat taatatggta aaattttgtttttattaaaa atataaaata 1620 attaggtgtg gtggtaggcg tttgtaattt tagttatttaggaggttgag gtaggagaat 1680 tgtttgaatt taggaggtgg aagttatagt gagttaagattatattattt tatttttttt 1740 tgggcgatag agtgagattt tgtttaaaaa aaaaaaaaaaaaaaattaaa aatataatga 1800 ttatttaatt tatttttggg tatataattg aattttaaaataattaaaag taggatttta 1860 aagagatatt tgtatatgta tgtttatagt agtattatttacgatagtta aaatatggaa 1920 gtaatttaag tgtttattaa taaatgaata gaaaagtaaaatgtgatata tatttataat 1980 ggaatattgt tagttttaaa aaggataaaa attatgatatatgtaataat atggatgaat 2040 tttagtaata ttaggttaag tgaaaaaagt tagttataaaaaaatattat ataatgttat 2100 ttatatgaga tatttagaat ggttaaaatt atggagatagaaaatggaac gatagatgtt 2160 aggggatgag gggaaaggga agttggagtt attgtttttttgttttgttt tgttttgttg 2220 tttgagatag agttttattt ttgttgttta ggttggaatgtagtgatacg gttttagttt 2280 attgtaattt ttgtttttta ggtttaagtg attttcgtgttttagttttt tgagtagttg 2340 ggattatagg tgtttgttat tatatttggt taattgtttgtatttttagt agagataggg 2400 ttttattatg ttggttaggt tggtttcgaa tttttgattttaggtgattt attcgtttta 2460 gttttttgaa gtgttgggat tataggtata agttatcgtttcgttttttg gagttgttta 2520 atgggtatag aaaaaatatt atgttttatg ttattaataaaatattattg aaagaaataa 2580 gaaaatgtgt taattggaag tataaattat tgagtgttaagggatataat ttaattgtgg 2640 tttaaattaa aaagtattat aagaaaatat tttaagatattttatagtgt ttgaaatgta 2700 aatttagtga ttataatatt ttagtaaatt aaattttttttagatttttt tttaagtatg 2760 aaaaaaagtg attatggaaa tataaattac gtaattattttttgtaaaat tttgtggatg 2820 tgttatattt aaattaagat tttaaaatat gtttattgttttaaaatatt atttaaaagt 2880 tattaatacg agtaataata tgatatattg tttgagataaaaattgtttg aaatggaaat 2940 aaattattta cggtttgttg taatgttttt tttattttttaatttattag tcgaatgttt 3000 tttaaaagta atattatttt agttatggtt attttagtgttgatgtttta tagaaagaga 3060 tttaagggtt aatttttatt aattattagt tataataatgaaagtattaa ttagaaggta 3120 gaaaaaaaga agattgtttt ttttatattt aatgtgtataaataatgtat gttttttaaa 3180 taaaggttta tttttttaaa aattgtttat tcgtttattatgatgaattt ttttaatttt 3240 tatagtattt aaattttttt ttaatttggt atatagagatatttatatat atatttaaat 3300 atatatatat atatgtatat gtaaatatat atatatatatatatatattt atttatttta 3360 atatatagat atatatatgt atatagtatt ggattgttttttattgatcg tattatttaa 3420 ttattagttt tattaatata tgaattggtt tagtattttttatatagtat ttatagtaat 3480 tagtataatt ttgtatttat agtaggaatt taagtatttagtagaaaatt ttattattaa 3540 attttaatat atagtatttg gtagatgtgg gtaaatggttagggaatatt aagcgatgtt 3600 tttaaagtgt tttatttaaa ttggggtagg tttaaaggagttaatgaaaa attaagaatt 3660 ttgtaatttt tttaaaaaga gtaataattt aatatattttttttttatta atataattag 3720 gtatataaga aatgagattg gttgggtatg gtggtttatatttgtaattt taatattttg 3780 ggaggtcgag gtaggtagat tataaggtta ggagatcgagattattttga ttaaaacggt 3840 gaaatttcgt ttttattaaa aatataaaaa attagtcgggcgtggtggtt tttttttgga 3900 tttttagtta ttttggaggt tgaggtagga gaatcgtttgaattcgggag gtggaggttg 3960 tagcgagttt atatgtgttt tatgaatatt agtttacgttatagtgtgag atttttttta 4020 aaagaaaaaa aaataataat ttttttgtta gaggtgagagagtagaaaaa aaattaatta 4080 gatttttaaa tttttgtacg ttttttagta gagacgggtttttttttgtt ggttaggttg 4140 attttgaatt tttaatttta ggtgattcgt tcgtttcggttttttaaagt gttgggatta 4200 taggcgtgag ttatcgcgtt cggttataag acgttttattgtaatataaa aataggatgt 4260 aacgagtttt ttaattatta atgtaattag agttggttattaagtttttt tacgcgtttt 4320 ttattatgag ggagaaacgg attgtagata aatttagtattttttgagta gtttaattcg 4380 tattataaat atgtaggtat cgtaaggacg cgattttttagtttgttagg ttttttttta 4440 tttttttggg ggtataaggc gattttgttt tttgatttaaaaatttcgta aacgttaatt 4500 tttttatttt tttttggtta gtttacgaaa gtagtagtatggtataattt ttagtttaga 4560 gttcgggtat tgtttgtcgt tagtataacg aagaaatttatatttacgaa gattttagat 4620 tttacgtgat tatattattt aattattagc gttggtttggaggaattcgt tgttacgtga 4680 tcgttcgtgt ttaatgatcg aggtttacgt tttttagatcgttatagtcg ttgttatagg 4740 gtttgagttt gggcggcgtt tcgtttcggt cgtacggtgcgtcggcgtta atttttttcg 4800 aaggtttcgg tagttaagat tgtaggtttt tattaagtattgttttcgaa ttgggttacg 4860 agagcgtgtt tttgattggt ttgttttgga ggttgggaagggatttgtta gagattgcga 4920 ttattttttg aagcgcgagg taggaagtta tatgttttttttggagtttt gtagagaaag 4980 tgttttttgt cgtattgata gtagcgagag ttggaggtgttgggtcggga gaatagtttg 5040 ttcgattttc gtttgtagtg tatggatgtt gggttattttatttatgatt atttacgatt 5100 gtatattttt taaaattcga aattcgatag tttatgtatatagaaatttt ttaggatttt 5160 tgatatcgat ttagatggta tatatataga tattatataggtttttattt agaagattgg 5220 atttatcggt tttagttatt tcgagattgt agataagtaagtgtttttat cgttttgagt 5280 tttgttatta tttcgtgaat tatcgaattt ttgttttagcgcgatagatt tggatttgag 5340 aatgtacgga tttaaaacgt ttagatttag atttttatagatagtgtttt gtatcgtttt 5400 tgatatgtaa tttaatattt tatataatga tataaatcgataacggcggt tagggaattt 5460 tagttatttt ttggatatga agagcggttt tttgtcgttaggcggttggg atgatagtta 5520 tttggattta gcgggtcggg aaggggatag agaagtttttttgggggata tcggtattgg 5580 cgatttttta aaagttttat agagttttcg ggtcgaattaagtagtattt tgttattatt 5640 ttttttttac gtgttttagg gtattttttt gggtttggcgggaagtattt tatttatttt 5700 gtaaagtaaa aatgttagtt atatagatta agttttttttagttttgttt tttggttttt 5760 tagttttaaa ttattttggg tttcgttggt tgatgcggtttacgttaaga atttcggtcg 5820 tcgtaaattt tggtttgttt cgatatagta tatattaggattttttatga tttatttatt 5880 tatttaggtg gatcgtttgt ttgggaatat cgatgatagaatattcgacg tgattgtttt 5940 tattgtggcg ttttttttgt ttgaattttt ggtcgttatttaggatattg tcgtcgatgg 6000 ttgggcgtta attatgttat ttagggaaaa tg 6032 66032 DNA Artificial Sequence chemically treated genomic DNA (Homosapiens) 6 tatttttttt ggataatata gttaacgttt aattatcgac ggtaatgttttgagtggcgg 60 ttaagaattt aaataaaaag aacgttatag tgagagtaat tacgtcgggtgttttgttat 120 cggtattttt aagtaaacgg tttatttgag tggataaata gattatgaagagttttagta 180 tatattgtgt cgggataagt taagatttgc gacgatcgaa gtttttaacgtagatcgtat 240 taattaacgg ggtttagagt aatttgagat tgaagggtta aaagataaaattgaagaaag 300 tttggtttgt atagttaata tttttgtttt gtaaaatgag tgggatgtttttcgttaagt 360 ttaggggaat attttgaagt acgtaaagaa agagtagtag taaaatgttgtttagttcgg 420 ttcggaagtt ttgtggggtt tttaagaagt cgttagtgtc ggtattttttagaagagttt 480 ttttgttttt ttttcggttc gttgagttta aatgattgtt attttaatcgtttggcggta 540 ggggatcgtt ttttatattt agagagtgat tgaaattttt tggtcgtcgttgtcgatttg 600 tattattatg tgagatgttg gattatatat tagagacgat gtagagtattatttgtgggg 660 gtttgagttt gagcgttttg gattcgtata tttttaggtt taagtttgtcgcgttggaat 720 agggattcgg tggtttacgg gatggtggta gggtttagag cgataagggtatttatttat 780 ttgtagtttc ggagtgattg aagtcggtga gtttagtttt ttggatagaggtttatatga 840 tgtttgtata tgtgttattt agatcggtgt taaagatttt gaaggatttttgtgtgtatg 900 gattatcggg tttcgagttt tggagagtgt gtaatcgtag gtggttatggatgagataat 960 ttagtattta tatattgtag gcggggatcg aataggttgt tttttcgatttaatattttt 1020 agttttcgtt gttattaatg cggtagagag tatttttttt ataggattttagaaaaagta 1080 tataattttt tgtttcgcgt tttaggaagt ggtcgtagtt tttaataggtttttttttag 1140 tttttagagt aagttaatta gggatacgtt ttcgtggttt agttcggaaataatgtttgg 1200 tgggaatttg taattttggt tgtcggaatt ttcggggagg attaacgtcggcgtatcgtg 1260 cggtcggggc ggggcgtcgt ttaaatttag gttttgtgat agcgattgtggcggtttgga 1320 aagcgtgggt ttcggttatt gggtacgagc ggttacgtga tagcgggtttttttaggtta 1380 gcgttggtgg ttgagtgatg taattacgtg gggtttgaag ttttcgtgggtgtaggtttt 1440 ttcgttatgt tgacgatagg tagtgttcga attttaggtt gggagttgtgttatgttgtt 1500 gttttcgtgg gttgattaga aaagggtaga aggattgacg tttacgaagtttttgaatta 1560 ggaggtaagg tcgttttgtg tttttaaaag gatagaaaaa ggtttggtaaattggagaat 1620 cgcgttttta cggtgtttat atatttatag tacgaattaa attgtttaaggggtgttagg 1680 tttgtttgta gttcgttttt tttttatggt ggaagacgcg tggggaaatttggtaattaa 1740 ttttaattat attggtgatt ggaagattcg ttatattttg tttttatgttgtaataaaac 1800 gttttgtggt cgggcgcggt ggtttacgtt tgtaatttta gtattttggaaggtcgaggc 1860 gggcggatta tttgagattg ggagtttaag attagtttga ttaataaggagaaattcgtt 1920 tttattaaga gacgtatagg aatttgagaa tttgattaat tttttttttgtttttttatt 1980 tttggtagaa agattattat tttttttttt tttgagagga attttatattgtagcgtggg 2040 ttggtgttta tgaggtatat ataggttcgt tgtagttttt atttttcgggtttaagcgat 2100 ttttttgttt tagtttttag agtagttggg agtttaggaa aaagttattacgttcggtta 2160 attttttgta tttttagtag agacgaggtt ttatcgtttt agttaggatggtttcgattt 2220 tttggttttg tgatttgttt gtttcggttt tttaaagtgt tgggattataggtgtgagtt 2280 attatgttta gttaatttta ttttttatat atttagttgt attgatggaaggaaagtgtg 2340 ttagattatt attttttttg agagagttgt aggattttta attttttattaattttttta 2400 ggtttatttt agtttaaatg aaatatttta aaaatatcgt ttaatattttttagttattt 2460 atttatattt gttaagtgtt gtatattaag gtttagtgat aaaattttttattaaatatt 2520 taaattttta ttatggatgt aaggttatat taattattat gggtattgtataggaagtat 2580 tagattagtt tatatattga tggaattgat agttaaataa tacgattagtagagaataat 2640 ttaatattat atatatatat gtatttgtgt attggggtgg gtgggtgtgtatatgtgtgt 2700 gtatatgttt atatatatat gtatgtatat atgtttaaat atatatataaatgtttttgt 2760 gtgttagatt gggaaagaat ttgagtatta taaaagttaa aagaatttattataatgaac 2820 gagtggatag tttttgaaga agtgggtttt tatttgaaag atatatattgtttatatata 2880 ttagatatag agaggatagt tttttttttt tttatttttt aattagtgtttttattattg 2940 tgattaataa ttagtgaggg ttaattttta aatttttttt tgtagaatattagtattgga 3000 atggttatag ttggaataat gttatttttg agaagtattc gattggtaagttaaaaaatg 3060 aaaaagatat tataataagt cgtaggtagt ttatttttat tttagataatttttatttta 3120 aatagtgtat tatattgtta ttcgtattgg tagtttttaa atagtattttagaataatga 3180 atatatttta aggttttggt ttaaatataa tatatttata ggattttatagaaagtaatt 3240 gcgtggttta tatttttata attatttttt tttatgttta aaaaggaatttgaaaaggat 3300 ttagtttgtt agaatgttat aattattaaa tttgtatttt aaatattgtagaatatttta 3360 aagtgttttt ttgtggtgtt ttttgattta gattatagtt gaattatgttttttagtatt 3420 taataattta tgtttttagt tagtatattt ttttattttt tttaataatgttttattggt 3480 agtataagat ataatatttt ttttatgttt attaaataat tttagggggcggggcggtgg 3540 tttatgtttg taattttagt attttaggag gttgaggcga gtggattatttgaggttagg 3600 agttcgagat tagtttggtt aatatgatga aattttgttt ttattaaaaatataaataat 3660 tagttaggtg tggtggtagg tatttgtaat tttagttatt taggaggttgaggtacgaga 3720 attatttgaa tttgggaggt agaggttgta gtgagttgaa atcgtgttattgtattttag 3780 tttgggtaat aagagtgaaa ttttgtttta aataataaaa taaaataaaataaaaaaata 3840 ataattttaa tttttttttt tttttatttt ttggtattta tcgttttattttttgttttt 3900 atgattttga ttattttaga tattttatgt aagtggtatt atatggtatttttttgtgat 3960 tggttttttt tatttagttt ggtattatta agatttattt atgttgttgtatatattata 4020 atttttgttt tttttaagat tgataatatt ttattgtaag tgtatattatattttgtttt 4080 tttgtttatt tgttgatgga tatttgggtt gtttttatgt tttagttgtcgtgaataatg 4140 ttgttatgaa tatgtatata taaatatttt tttgagattt tatttttagttattttgaga 4200 tttagttata tatttagaag tggattagat ggttattgtg tttttaattttttttttttt 4260 tttttttgga tagagtttta ttttgtcgtt taggaaggag tgaagtggtgtgattttggt 4320 ttattgtaat ttttattttt tgggtttaag taattttttt gttttagttttttgagtagt 4380 tgagattata ggcgtttgtt attatattta attgttttgt atttttggtagagatagggt 4440 tttattatgt tggttaggtt ggtttcgaat ttttgatttt aagtgatatatcggttttgg 4500 ttttttaaag tgttgggata ataatattcg ttttattttt aattttttgagtaattgtta 4560 tattgttttt tatagtggtt gtattatttt atgttattat taataatgtataagagtttt 4620 aattttagta tatttttatt aatagttatt attttttggt tttttgttagtagttatttt 4680 aatgagtttg aggtagtatt ttattgtggt tttgatttgt atttttttaatgattagtga 4740 tgttgagtat ttttttatgt ggttattggt tttttatata tgtttttgtgtaaatatttg 4800 tttagttttt ttgttttttt ttgaatgagg ttgtttgttt ttttgttgttgaattttagg 4860 agttttgtat attttgagtt tttgattaga taaatgattt gtaaatatttttttatattt 4920 attttgtatg ttgttttttn nnntttttnt tttntttttt ttttttggagataaggtttt 4980 attttgttga ttaggttaga gtgtattggt atgattatgg tttattgtagttttaatttt 5040 ttagttttaa gtgattttta tttttatgtt ttagtttttt gagtagttaggattaaaggt 5100 atttgttatt atgtttggtt aatttttaat ttttttgtag taatggcgtttttttgtgtt 5160 gtttaggttg gttttgaatt tttgttttta agtagttttt ttattttagttttttagagt 5220 gttgggatta tagatatgag ttattgtatt ttatttatgt gtttattttttttaattttt 5280 gttgagagtg tttattgatg tgtaagtttt aaatttttat gaagtttaatttgtttatgt 5340 tttttttttt ttattttaat ttttgtgagt atatattagg tgtatatatttatggggtat 5400 atgagatatt ttgatatagg tatatagttt ataataatta tattagagtaaatagggtat 5460 ttattatttt aagtattttt tttttcgtgt tgtaaataat ttaattatgtttttttagtt 5520 attttaaaat gtataataaa ttattgttga ttgtagttat tttgttgtgttattaaatat 5580 tagattttat ttattttatt taattatatt tttatattta ttaattaattttattttttg 5640 tttattttta gttatttttt ttaggttttg gtaattatta ttttattttttgtttttatg 5700 aatttaattt ttaaattttt tagttttttt aaataagtga gaatatgtaaagtttgtttt 5760 tttttgtttg gtttatttta tttaatataa tgatttttat tttatttatggtgttggaaa 5820 taatagtttt gtttaaggat gaatagtatt ttattatgta tatgtattatattttttttt 5880 tttttttttg agataaggtt ttattttgtt atttaggttg agtgtagtggtgtgattatg 5940 atttattgta gttttggttt tgcgggttta agcgattttt ttatgttagttttttgagta 6000 gttgggatta taggtgtgag ttattatgtt ta 6032 7 12409 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 7gttgtttgga agttgtttgg tattaggatg cggataatat ggttggagaa atggtaattg 60ttagggtatt tggagtaaga atggatagat attggtgatt attatttgga tgtatttgag 120ggataattgt tatgttttta ttagagtaat tatatagagt aggagtaagt aatttatagt 180ttatagatta tatttgtttt gtttcgtttt ttaaatatag tttaatggaa atagagttat 240gttcgttttt ttatttattt tgtatggttg atattaggta tggttttaag taatatatat 300aagttttata tattaatgtt tatttatttt agttgataaa tatgaagtgt tgttattgtt 360ttattttata gcggagaaaa ttgatataga gatttttttt cgtatttata gttttagtta 420ttatttttat gttaatgatt taataatatt tttaatttag attttttttt tgagttttag 480ataggtagat tttttatagt tagttttgga gatattttag aaattatagg ttttaaatta 540gatttttttt tattttttta aatatatttt tttttaatat tttttttttt ttagtgaata 600ttattaaata gataagtaag ttagatttaa ggaggttttt ttggtatttt ttttattttt 660gttttatttt atattattta tttttttttt tttttttttt tgagatggtg ttttattgtg 720ttatttaggt aagtgtagtg gtgtgatttt ggtttattgt agttttaatt ttattaagtt 780taggtaattt ttttatttta atttcgtgag tagttgggat tataggtata tgttatcgag 840ttcggttaat ttttgtattt ttattagaga tagggttttg ttatgttgtt taggttgtta 900ttttattttt atttttgttg aaatttggtt gttttttttt atttttatta ttaattatta 960gttaaatttg atttattaaa aggattattt cgtatgtggg ttttgtaata gtttttttaa 1020aatttatttt tttttattta gatttttttt taatttttaa attgtagtta atatttttaa 1080ttttgttatc gtttttgtat attttattta atttttaatt ttttaatggt tttttttgtt 1140tttaggttaa gttaaattga aaattgttaa agttatagtt ttttagtgta attagtaagt 1200atagtgatta ttatgtttgg tttattttag ttgttgttga ttaatagtat tttttgaatg 1260aagaaattat attatcgtat tgtagggaaa aatttgtatt ttaatggaaa attgaattat 1320ttagagtaaa tttttaaggt tatttgattt tgattttatg ggttttttta ttgggtttta 1380tattgtttta ttgtttttga gttattttat agatgattga tagaaatgta aaataattat 1440tgtatgtagt tatgtaagta aaatttgaag gttagggttt aattaatttt ttttttttat 1500tgtggaagaa gttaatttta tttgtatatt tattttaata tttttgattt ataaatatgt 1560ttgttttttg aattagtttt tatatttgtt tggtaatttt attaaatgat ttaaataaat 1620tttataattt agtttatttt atatttgtat gatagttagg tttttatttt atttttgttt 1680tttaaaatta ttttttagtt ttttttaagg tattatttgg ttggtttttt ggttatttat 1740tagtttaagt tttatttttt tttgtttatc gtagttttag gttttttttt ggttttttgt 1800tttagttttt tttagagaag tttttttgtt ttggaattta tttttatatt aggtgttttt 1860tatttttttt ttttttagta aattttttta attttttaga tttttgttta aggattattt 1920gttgaaagtt tttttaggtt tttttgagtt aatataattt attattagag gtttttagag 1980tataggtagt atttgttata attttatatt tgtttgtggg attttttaat attttttaat 2040ataattaata tttttttttt tggttggggg taatgtatga taataggatg atggtatgtt 2100tttaattttt ttttagtaat tagtttagtg tttcgaatat ggtggataga tatatcgttt 2160ttattttaga tagatttttg agtagtaagt atttattgtt taggagatag atggattgaa 2220aaaatatatt tgggagttat tagtatatag gtgtagttat gaaaatgtac gagaagtaaa 2280attattggta ggaataaaat gaaggttatt agagatttta tttaggtgga ataattggat 2340agaagttttt aatggggagg aaatagaagt agttaatata gatggaggtc gggcgtcgtg 2400gtttacgttt gtaattttag tattttggga ggttgagata ggtgggtggt ttgagtttag 2460gagtttgaga gtagtttggg taatatagta aaattcggtt tttataaaaa atataaaaat 2520tagttcggcg tggtggcgta ggtttgtagt ttcggttatt ggggaggttg agatgggaga 2580attgtttgaa tcggggaggc ggatgttgta attagacgag atcgcgttat tgtattttag 2640tttgggcgat agagcgagat ttcgttttaa aataataagg ataaaattta ttttataagc 2700gattttggat ttttagggat attcgtcgtt ttatggtggt acgtgatttg tttggatttt 2760gtggtttttg gagtttggga ttttatttta gcgtaagagg tttttttgtg ttttgtataa 2820aggagaggaa aagtgtaggt tttttgagtt gataagatta gagttatagt atattattag 2880tagcgttgta tgaaattatt taaaaaatta aatcggattt aatcgttttt atttagaata 2940aattgttttt tttttttttt taagattaag ttagttttag ttattatttt ttattaattt 3000aaaaattagg aaggtttata atttaggttg acgttgcgtt taggcgaata ttgtatataa 3060gataatagtt attttaattt tttttttttt ttttaaatcg aatagtattt ttaatattat 3120ttttttagtt ttttttttaa atattgcgat tacgagttta tatcggaaaa ttatgaaaat 3180agtatgattg gagtttttga tggtttgttt tgtttgaaaa cgatgaaagg tattgagatt 3240tttgggtaga aatggttttt agggaatgcg agtttggtag ttttataata tttcgagtta 3300taaattcggt ttgggtaggt ggcgtaggga aatttaaaag ttggatttac gttttttttt 3360tttagtttgt atatagcggt tagtggtaga taagagtaga cgtataaatg ttaattttcg 3420ttcgtaaatt ttcgagggta gaaattgttt tttgttagtt ggatttggag tcggtggaaa 3480agttgtttta atgtagtttt ttcgaggttt ttttagtttt gatcgagggg cgtttttcgg 3540ttatttattt agaggttgtt taataaataa ggatgttcgc gaaatatttg cgtttggaaa 3600ggcgttcgtt cgtggcgcgt attttcgggt tttcgtaagc gatttcggtg atagggataa 3660tcgtttcggt tttagcgatt gtagatagat tgggacgaga cggttggagg ttttttttta 3720agggatgttg gaggggttgc gtcgtatttt gcgtttggtt ttggcgcgcg gttttaggtc 3780gtggtattta gcgttttatg ggtcgtgcgt cggggtttgg ttatatcgtt tgttttcgtt 3840tttagtcgcg cgtttcgtgt tattgtcgtt ttttgtagtt tcgcgttttc gtagtttttt 3900tatggttagt tcgtttcgtt tcgttgcggt ttttgttcgt taggtatttc gaattcgggc 3960gtttgcggaa ggggggagga ttggaattcg ggtttcggta gttcgcgggt ttggtcgggc 4020gttttgtcgt cgttttttgt attatttttt ttcgttttgt tttttatttc gtttttagcg 4080aggcgttttt tttttttcgt atttttgttc gaaatttgga gtttagtttg taatttttat 4140tttttcgagg ttttcgttgt ttaggtttag tatttttatg ggtaattcgt ttcggagcgt 4200ggcgaggatc gttacggggg acgtgagggt agttatggat tcgttttgag ggaggaggcg 4260ggagttgaat ttttgggttg ttagaattta tagttatatt ttacgtgatt ttgttatttt 4320aaaatatttt gatcgtagtt ttttgttttt ttggattttt ttttttttta tttttatttt 4380cgtagttatt tagtagatta cgtattaaaa taaatgtttg taggtttttt taattagttt 4440cgtttttttg tgtttttatt ttttaaattg tttattaata ttatgaggtt taaggtgtgg 4500ggtggatgtt gcggtatcgg aggattttgt tggtggagga aatggtttac gttcgttttc 4560gttttttttg taggtttgtt attgtgcgtt tgtgattgat aagattacga ggttgagcgc 4620gttttggaga tttttttata aatggtttaa tattttagtt tagattattt gttcggatat 4680aagggagata attgtttttt tgttttttgt cggcgaattt tggttttgta gggttgattt 4740ggaatttaat tagttttttt tgagtcggcg gaggaggata aaaatcgtcg cgatttcggt 4800agggtgggaa gtgtagggta gcgtttttaa gatacgtttg ttggaggttc gggtttgggt 4860gtttggttgt ttgagttttt ttttttgtgt ttgtttgggt tttggagagg agcgtacggt 4920attatggtga gcgttacgta ggttatttcg ggtttcgttt atttatttgt atttatttaa 4980tggtggttta attttttttt aaggattgta gtaacggatg tttcgtagag tgtatcggag 5040aaggaggatt aaaagaggtg gtggggattt ttaaggtaag ttgtttgtta gaggtttagt 5100gtttaaagta acgtttaatt gaataaattt attttttgtt gagattcggg gaaattttta 5160ttgtgtgggt tatttagttt ttaggttgtg ttgttagatt tttaaaattt tatttttaga 5220ggaaaaaaag ttatttagag agtgatagta tatttattat aataaaaatt atttagtagt 5280taattgttga ttttattttg agttatatat tttttttgaa aaatagttaa tgcgtaaata 5340ttaaattagt tgtttattag attttataat acgtataaat ttttagttta tttgtagaaa 5400aagttaaatt gtgatttttt ttttttagta gtatataata ttttatagtg aaagtgttgt 5460attttttttt tttttatttg aattgcgggg tttatatagt aaatagttta tattttaaat 5520agtgagaaat aaagtacgtt gaaaattgta taaatataaa tgtaagatgt aatattattt 5580tttttataag tttatttttt attttttttt ttcgtggagg ttttagtttt ttttttttat 5640gtttagtgtt gtttttttgt ttgtttgagt tattgttaat tgttattaga taattgatat 5700agagtgtttt aatgatttta tattttggcg gtttagagag ggaaggaaat ttgatttatt 5760agttttttat atattgagtt tttttatagt gtgttggaga ttgtgttatg tattggatat 5820ttaaaggtga atttaagatt aggtttttat ttgtaaggaa tttttatttt attttttttt 5880tttttttttt tgttgttatt ttagtaagga ttttttaaaa agtaaaatta gaatattgta 5940attttttttt tgttttttga gatagggttt cgttttgtta tttaggttgg agtgtagtgg 6000tacgatttta gtttattgta atttttgttt tttaggttta agtgattttt ttgttttagt 6060tttttgagta gttgagatta taggtatgtg ttattacgtt tagttaattt tgtattttta 6120gtagagatgg ggttattatt atgttagtta ggttggtttc gaatttttgg ttttatgtaa 6180tttatttttt aaagtgttgg gattgtaggc gtgagttatt aagtttagtt tgaagaattt 6240tttgtaaaga aaaatattaa tttaaattta aataattttt tttttttttt tttttttttt 6300tgagatagag ttttgttttg ttgtttagat tgaagtgtag tggtattatt aattaggtat 6360tatttttagt tttgattttt tagatttaag tgattttttt agttttttaa gtatttgaga 6420ttatcggttt gtatgttatt aggtttaatt aatttcgtta ttttttgtag agatgggatt 6480tttttgtgtt gtttagattg atttttaatt tttgggtttg tgtaattttt ttatttcggt 6540tttttaaaat gttgggttat aggtataagt tataatgttt ggttataaat aatttttttt 6600atttgttaat ttagattttt gtatattagg ttttatttag gggaattgtt tgtttatatt 6660tatgtattta tatattaaaa tatgagttat ggtggatgta tttatagtat atatgtaata 6720aggtatgtgt aaaaatgata ttgataattt agggaataaa aatggtagat tttatagatt 6780atttttgttt ttgatatatt tttttttgtt ttaaaaaata aaaataaaaa taaataaata 6840aataaaatat atatatatag tttatattgt tgttaattat aattatttta ttttgttatg 6900aatagtagat tttatcgttt ttatttaatt gtatgtttgt atttattaat taattttttt 6960ttttttattt atattttttt tattttttgt tattttttga tatttattat tttatgagta 7020tttttttttt ttatgagatt aatttttttt tttagttttt acgtatgagt gagaatatgt 7080aatatttgtt tttttgggtt tttttttttt tttgtgtttg gtttatttcg tttattataa 7140tgatttttag ttttatttat gttgttataa atgatacgat tttatttttt tttaatggtt 7200tagtagtatt ttattgtgta tatgtattat attttatttg tttattgatg gatatttagg 7260tgattttatg ttttgattat tgtgaatagt gttgtaataa atatgggatt gtagatattt 7320ttttgatata ttgatttttt tttttttgga aaatatttag tagtaggatt gttggtttat 7380atggttattt tatttttagt tttttttttg gaaagtttta tattattttt tatagtagat 7440aaattaattt atatttttat taatagtgta taagcgtttt tttttttttg tatttttatt 7500agtatttgtt attttttgtt tttttaataa taattatttt aattgtggtt gtttttgata 7560tattttttta tttttttgtt aatttatatt atttataata ttttatatgg ttttttgggt 7620tttttttggg tagtttttat attttttttt ttttttttat ttatgatgta gttatattat 7680atgaggatgt agttttgtag tagggtttat taatgagaaa cgttggtata tattttggcg 7740aatttttttg tggattttag gatttttttt atttgtaaga ggttagttat ttattttttt 7800taattttttt agttttatat atttttatag aatgtaatat tgtaaatttg tagttttttt 7860tatgattttt tttattagat tttaaaagag tatttttaaa agatgaatat agtgtttaag 7920gttttttaaa tggagtaaga ataatgtata agaatttaga ataaagttat taaatgtttg 7980atatagttgt aatatagatt tgatttttga aaaatgtggt taatgaagag aagagtaaat 8040gtgttatacg atggtgagta aaaggtgttg ataggtttgg tatggtgatt tatttttgta 8100attttagtat tttgggaggt tgaggtgggt ggattatttg aggttaggag tttgagatta 8160gtttggttaa tatggtgaaa ttttgtttgt attaaaaata taaaaattag ttaggtgcga 8220tgatatatgt ttgtaatttt agttatttgg gaggttgagg tttgagattt gtttgaatcg 8280gggaggcgga ggttgtagcg agtcgagatt gtgttattgt attttagttt gggtaataga 8340gtaaaaaaaa aaaaaaaaaa aaaaaaaaaa agtgttgatt gaattttggt tgaaatagtt 8400tttaggtgtt tttaataaat ttatattttt ttgttttgag tttttttatt ttagaataaa 8460tgattattta attgtaaatt ttgaattagg aagttgtttt taatatgttt tgtttttttt 8520aatatttttt gttattttat aattagttat tgtggtattt taattttttt ataaatatat 8580gatgtgaaat attttgattt cgatgttatt agggaatgtg gagtattgga aagagataga 8640ttaattatgt agaagaaagt attatttgat aaaatattat tttaatttat ttttggaaag 8700gaaatttaga aaaagaaaat attttttaaa gaatattgat aaaaattgtt tataaaattt 8760gtttttttta ggaaataaat cgttttttta aaattatatt ttatatttgt tttaaacgag 8820ttatatgttt ttagttaata ttgtttgttt acgtttgaat tttatttaat tttattattt 8880agtaatttag tatttttagg taattttttt ttgagtttag gttaaaagtt gttattttta 8940gtttttagag ttgtagaatt ttttttttaa gtagagaaaa gtttatgatg agattttgaa 9000gttatttaat cgtatattat tttgaaaaat tggatatatg tcgggcgcgg tagtttatat 9060ttgtaatttt agtattttta gaggtcgagg tgggtgggtt atttgaggtt aggagttcga 9120gattagtttg gttaatatgg tgaaatttta tttttattaa aaatataaaa tttagtcggg 9180tgttgtggta tatgtttgta gttttagtta tttaggaggt tgaagtagga gaattatttg 9240aatttgggag gcggaggttg tagtgagttt agattatatt attgtttttt cgtttgggtg 9300atagagtgag attttattta aaagaaaaag taaaataaaa taaaattgga tatagggtag 9360tgtttaggta taaattagaa agttagaggt tgttatttat attattaaga aataatgtgt 9420tttacgaaag aatgtagtag tttattgaaa tagaagttat atttagaaat gtaataattt 9480atttttaatt gttagaaatt taattgatat tatgaagttt taattataag aatatttatt 9540tgaggttaaa aattatttta ttttattttt gttttgtcgt taatttgatt tttttggatt 9600agtgggttat tgtgggtttt atgggtattt taaggagagg ttttagaaaa ttaaaaatta 9660tatatattgg attataatta tttttgttat ttatttttat ttttttgttt ttgttttgtg 9720ttttattatt tttttttttt tattaagtag ttttagtaga agaaaatttg tattaagttt 9780gtcgtattgt attgatatgg ttttaaatgt tttttagttt agggtttttt ttatttattg 9840ataaaagtta attaaggtaa attataggtg tttattgtgt aagaatattg tgaaattatt 9900tatgtaataa aaagtttgtg ttagaatttt atttttttta aattttggat attttttgtg 9960agtgtatttg aaagtagtta gatattttta gtatttaaga aattttttat tattttgtgt 10020gttaggtatt gtgttagttt tggaatttaa ttgtgaatat tttagttaga ttttttgttt 10080aaatagttta gaataggggt tgttaaattt tttttttttt tttttgagat ggagttttat 10140ttttattgtt taggttggag tgtattggtg tgtttttgtt gattgtaatt tttgtttttt 10200aggtttaagt agtttttttg ttttagtttt ttaagtagtt gggattatag gcgtttatta 10260ttatatttag ttaatttttg tatttttagt agagataggg ttgtgttgtt tgttaggttg 10320attttaaatt tttgattttt ggtgatttat tcgtttcggt tttttaaagt gttgggattt 10380agggtgtgtt attgtgttcg gtttgttaaa tttttttaaa tggttagatg ataaatattt 10440taggtttgag ggttattagg tttttgttat aattagttgg ttgtgttgtt attgaagata 10500taagaatggc gtgattatgt tttaataata ttttaatttt aaaataggtt agttggttgt 10560atttggtttg taagtaaagt ttgtttgatt ttttatttag tttagaggat aacgggagag 10620aaaagggatt taaagataaa aataatttag ttggaatata tttttttaaa taaatttatt 10680atatttagta aaaagtttta aattaacgtt tttatttgaa ttaaatagtg gtaaaatagg 10740ttgggtatag tggtttatgt ttgtaatttt agaattttgg gaggtcgagg taggtagatt 10800gtttaagttt aggagttcga gattagtttg ggtaatatag tgagttttta tttttaaaaa 10860aaatataaaa taataataat aatggtagaa taaagttaat tttttattga aatttggtat 10920tttattggta tattataaag tagtattatt agattagttt gaatattata gtaatatttt 10980gtttttaatg ttttttgtgt tattgtaata tgagtttttt gtttgttttg gaatatgttt 11040ttagtttgaa tattatttta aaaatataat ttattattat ttataatata ttaaatgatt 11100tacgtagttg taaggtagtg aattaaatag aattagatta ttttaaaaat aatgataaga 11160gttgatgatg taaagtgaag gtttgtattt aatttgggag ggaaaagatt ttttttgtat 11220atttaaagag atggagtttg atattttttt ataatttgtt ataggttgaa tttgtttttg 11280tttttttaat tgattaaaaa gttttttttt ttgtgttttt tttttttttt tttttttttt 11340tttttttttt tttttttttt ttttttgaga tagagttttg ttttgttttt taggttggag 11400tgtagtggtg cgattttgat tttttgtaat tttcgttttt cgggtttaag tgattttttt 11460gttttagttt tttgagtagt tgcgattata ggtgtatgtt attacgtttg gttaattttt 11520agtattttta gtagagacgg ggttttatta tgttagttag gatggtttta atttttaaat 11580tttgtgattt gtatgtttcg gttttttaaa gtgttggttt tttgtgtttt tgttagtatt 11640ttatagatgt tataaagtta gtggtggtat cgtatgtaat ttgtacgttt aatgtttggt 11700tatttgtagt gggtaaattg gttatgtcgg gagttggtga gatgttgttt gtggggagtt 11760gttttttagt attttgattt atttttgttt aaataagagt ttttttgttt attgtttttt 11820ttatatagaa tagaggattt atattttagt gtttattttt aatttttttg tttttaaaga 11880ggaaaatatt tgttttattt tgtttatttt ttttttagtg tatttagagg attttgaagg 11940tttatgttaa taattttttg gggtagttgg agtgtaatta ttgttaaata gtagtttagt 12000atttaatgat atttatttta gtttaataaa ttattgtgag tgttgttatt ttttattagg 12060gaaaatattt tttttatttt ttttaaatat ttaatatgag ttttatggtg agagtgaaaa 12120agggttgtat tttttttttg tattatttta ttttatttgt tattttgttt tttttttata 12180tattattgaa atttggtttt gatattttat taggtagtgt atattgtaga gattatgaat 12240aattggtcga attttgaatg taggtatgat ttgtttagtt tagagtgtta aatttttgtg 12300ttagttgtta atttttaaaa gttaattgat tttttttttt tttttttttt ttgtataatt 12360tagttagcga atgtttagta gtttttttgt aaatagtgat gattttttt 12409 8 12409 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 8agaaaaatta ttattattta tagaaaagtt attgagtatt cgttggttag attatataga 60ggggaaaaaa aaaaaggaaa ttaattgatt tttaaaggtt agtagttaat atagaaattt 120aatattttga gttgaataaa ttatgtttgt atttagaatt cggttagtta tttataattt 180ttgtaatgta tattgtttaa tagaatatta gaattaaatt ttagtgatat atagaagagg 240gataaaatag tagatggggt aagatgatgt aaaaaaagaa tataattttt ttttattttt 300attataggat ttatgttgag tatttgggaa agatgaaaga gatgtttttt ttaataaaaa 360atggtaatat ttataatgat ttgttaaatt aaaatgaatg ttattaagta ttgaattgtt 420atttagtaat ggttatattt taattgtttt aaagaattgt tggtataagt ttttaaaatt 480ttttgggtgt attggagaag aaatgagtaa agtgaagtaa atgttttttt ttttgaaaat 540aggaaagttg agaatgaata ttaagatata aattttttgt tttgtgtgga ggaaatagtg 600aataaaggaa tttttattta aataaagata aattagagta ttaggaaata attttttata 660agtagtattt tattagtttt cgatatagtt agtttgttta ttgtaaatgg ttaaatatta 720agcgtataaa ttgtatgcga tattattatt aattttatag tatttgtgga atgttgataa 780aaatatagga gattagtatt ttgggaagtc gaggtatgta gattataagg tttggagatt 840gagattattt tagttaatat ggtgaaattt cgtttttatt aaaaatatta aaaattagtt 900aggcgtggtg gtatgtattt gtagtcgtag ttatttagga ggttgaggta ggaaaattat 960ttgaattcgg gaggcggagg ttgtagagag ttaagatcgt attattgtat tttagtttgg 1020gagatagagt aagattttgt tttagaaaaa aaaaaaagaa aagaaaagaa gagaaaagag 1080aagaaaaaaa gaaatataag agaaggaatt ttttgattag ttaaaaaaat aggggtaagt 1140ttaatttgta ataggttgtg aagggatgtt aaattttatt tttttgaata tataaaaaaa 1200gttttttttt ttttaaatta aatatagatt tttattttat attattagtt tttattatta 1260tttttaaaat gatttaattt tgtttaattt attgttttgt agttacgtga gttatttgat 1320atattatgaa tgatagtaaa ttgtattttt agaataatat ttaggttgaa aatatatttt 1380aaaataaata gaaagtttat attatagtga tataaaaggt attaaggata gaatattatt 1440gtaatgttta ggttagttta gtaatgttat tttgtaatat gttaataaaa tgttaagttt 1500taataaaaaa ttgattttgt tttattatta ttattattat tttgtatttt ttttagagat 1560agggatttat tatgttgttt aggttggttt cgaatttttg ggtttaagta atttgtttgt 1620ttcgattttt taaagtttta agattatagg tatgagttat tgtgtttagt ttgttttatt 1680attatttaat ttaagtaaaa acgttaattt aagatttttt attaagtata ataagtttat 1740ttaaagaaat atattttagt taaattattt ttatttttga attttttttt tttttcgttg 1800ttttttggat taggtagggg gttaggtaga ttttatttgt agattaaatg tagttagttg 1860gtttgttttg aaattaaaat gttattggaa tatagttacg ttatttttgt atttttagtg 1920gtagtatagt taattagttg taatagaaat ttgatggttt ttaagtttaa aatatttatt 1980atttagttat ttaagaaagt ttagtaggtc gggtatagtg gtatattttg aattttaata 2040ttttgggagg tcgaggcggg tggattatta aaggttagga gtttgagatt aatttggtaa 2100atagtataat tttgttttta ttaaaaatat aaaaattaat tgagtgtagt ggtgggcgtt 2160tgtaatttta gttatttggg aggttgaggt aggagaattg tttgaatttg ggaggtagag 2220gttgtagtta gtagagatat attagtgtat tttagtttgg gtaataagag tggaatttta 2280ttttaaaaaa aaagaaagaa agtttagtaa tttttatttt ggattattta gataagaagt 2340ttggttagag tatttatagt tgaattttaa agttaatata gtgtttagta tatagaatag 2400taaagggttt tttaaatatt gaagatgttt ggttgttttt agatatattt atagaagatg 2460tttaggattt aaagagagtg aaattttaat ataaattttt tattatatga atagttttat 2520agtatttttg tataataaat atttgtgatt tattttagtt agtttttatt agtgaatggg 2580gaggattttg ggttaagaaa tatttggagt tatattaata tagtacgata aatttaatgt 2640aaattttttt ttattaagat tatttagtaa aaggggaagg gtagtaaaat ataaaataaa 2700aatagaaaga tgagagtggg tgataagaat gattatgatt tagtatatat aatttttagt 2760tttttgagat ttttttttaa aatatttata ggatttataa taatttatta atttagagag 2820attaaattag cggtaaagta gggatagaat aaggtaattt ttaattttaa ataagtgttt 2880ttataattag aattttataa tattagttaa atttttgata attaaagata aattattata 2940tttttaggta tgatttttat tttagtaaat tgttatattt tttcgtaaga tatattattt 3000tttaatgata tgaatagtaa tttttaattt tttgatttgt atttaagtat tgttttgtat 3060ttagttttgt tttgttttgt tttttttttt agatggagtt ttattttgtt atttaggcgg 3120aagagtagtg atgtgatttg ggtttattgt aattttcgtt ttttaggttt aagtgatttt 3180tttgttttag ttttttgagt agttgggatt ataggtatgt gttataatat tcggttaagt 3240tttgtatttt tggtagagat ggggttttat tatgttgatt aggttggttt cgaatttttg 3300attttaggtg atttatttat ttcggttttt gaaaatgttg ggattatagg tgtgagttat 3360cgcgttcggt atatatttag ttttttaaag taatatacga ttaggtggtt ttagaatttt 3420attatgaatt tttttttatt tgaaaaaaaa attttgtaat tttgaaaatt aaaaataata 3480atttttaatt tgagtttaaa gagaaattat ttaagaatat taaattatta ggtgatagaa 3540ttgaataaag tttaaacgta aataagtaat attagttgaa gatatgtgat tcgtttgggg 3600tagatatgaa atgtagtttt aagggaacga tttgtttttt aaaggaaata aattttataa 3660ataattttta ttagtgtttt ttaaaaagta tttttttttt ttagattttt tttttaaaga 3720taaattaaaa taatattttg ttaaatgata tttttttttg tataattaat ttgttttttt 3780ttaatgtttt atattttttg atgatatcga agttaggatg ttttatatta tatgtttgtg 3840gaagaattgg aatgttataa taattgattg tgaaatggta agaaatattg agaaaaatag 3900ggtatattaa aaataatttt ttaatttaaa gtttgtagtt gggtaattat ttgttttgaa 3960atagggaggt ttagggtagg gaagtgtaaa tttgttgaaa gtatttgaaa attgttttag 4020ttagggttta gttaatattt tttttttttt tttttttttt tttttttgtt ttgttgttta 4080ggttggagtg tagtggtata atttcggttc gttgtaattt tcgttttttc ggtttaagta 4140agttttaagt tttagttttt taggtagttg ggattatagg tatgtgttat cgtatttggt 4200taatttttgt atttttaata taaatagggt tttattatgt tggttaggtt agttttaaat 4260ttttgatttt aaatgattta tttattttag ttttttaaag tgttgggatt ataggggtga 4320gttattatgt taggtttgtt aatatttttt gtttattatc gtatagtata tttgtttttt 4380tttttattgg ttatattttt taaaaattaa gtttgtatta taattgtatt agatatttaa 4440taattttatt ttaggttttt gtgtattatt tttattttat ttggaaagtt ttaggtatta 4500tgtttatttt ttggagatat ttttttaaaa tttaataaag aggattatga agagaattgt 4560agatttgtag tgttgtattt tgtggagata tgtgaagttg gaggaattgg aagaaataga 4620tggttgattt tttgtaaatg aagaggattt tagagtttat agaaagattc gttaggatgt 4680gtattaacgt tttttattgg taggttttgt tgtaaaattg tatttttatg taatatgatt 4740gtattataaa tggggagggg agaagaaata tgaaaattat ttaagagaga tttaaaaggt 4800tatatgaaat gttataaatg atgtagatta ataaaaaggt agagaaatat gttaaaagta 4860attatagtta gaatggttat tattagaaag ataaaaaata atagatgttg atgaggatat 4920agagaaaaga gaacgtttat atattgttgg taagaatgta aattagttta tttattgtgg 4980aaaatggtat gaagtttttt aaaaaaaaaa ttaaaagtag aatgattata taaattaata 5040attttattat tgggtatttt ttaaaggaaa ggaaattagt atattaaagg gatatttgta 5100gttttatgtt tattatagta ttatttataa tagttaagat atggaattat ttaagtgttt 5160attaatgaat aaataaaatg tggtgtatat atataatgga atattattaa gttattaaaa 5220aagagtaaaa tcgtgttatt tgtagtaata tggatggaat tggaagttat tatggtaagc 5280gaaataagtt aaatatagaa aaaaaaaaaa atttagaaaa ataaatattg tatgttttta 5340tttatacgtg agagttaaaa aaaaaagttg attttatgga ggaagagagt atttatagaa 5400tgatagatat tagaagatgg tagggggtgg gaagggtgta ggtggaggaa gagaggttgg 5460ttaatgagta taaatatata gttagataga agcgataaag tttattgttt atagtagagt 5520agggtgatta tagttaataa taatgtaggt tatatatata tattttgttt gtttgtttgt 5580ttttgttttt gttttttgag atagagaaaa gtatattaaa aataaagatg gtttataaaa 5640tttattattt ttatttttta aattattaat attattttta tatatgtttt attatatatg 5700tgttgtgaat atatttatta taatttatgt tttgatgtgt aaatatatga gtgtaaatag 5760gtaatttttt taaataaaat ttaatatata gaaatttaaa ttaataaata aaaaagatta 5820tttatggtta ggtattgtgg tttatgtttg tgatttagta ttttgggagg tcgaggtggg 5880agggttgtat aagtttagga gttggagatt agtttgggta atatagggag attttatttt 5940tataaaaaat gacgaaatta gttgggtttg atggtatgta agtcgatagt tttaggtatt 6000tgagaggtta agaggattat ttgagtttga gagattaagg ttgaaagtga tatttaattg 6060atggtgttat tgtattttag tttgggtaat agaataagat tttgttttaa aaaaaagaaa 6120aagaaaggaa aagattattt aaatttgagt tgatattttt ttttgtaaag aattttttag 6180gttaggtttg gtggtttacg tttgtaattt tagtattttg ggaggtggat tgtatgaggt 6240taggagttcg agattagttt ggttaatatg gtgataattt tatttttatt aaaaatataa 6300aattagttgg gcgtgatggt atatgtttgt aattttagtt atttaggagg ttgaggtagg 6360agaattattt gaatttggga ggtagagatt gtagtgagtt gagatcgtgt tattgtattt 6420tagtttgggt gatagagcga gattttgttt taaaaaatag aaaagaaatt gtaatatttt 6480aattttgttt tttaaaaaat ttttgttaag atgatagtaa gagaaggaaa aagaaaaata 6540aaataaaaat tttttgtaag tagagattta attttgaatt tatttttgga tgtttaatgt 6600atggtatagt ttttagtata ttgtgagaga gtttaatgtg tgagaaattg atgagttaag 6660tttttttttt tttttgaatc gttaggatgt gagattatta ggatattttg tgttaattgt 6720ttgatgataa ttgatagtga tttaaatagg tagaagagta gtattaggta taaaaagaag 6780aagttaaaat ttttacgagg agggagggta ggagatagat ttatagaaaa aataatatta 6840tattttatat ttgtatttgt atagttttta acgtgttttg ttttttattg tttgaagtat 6900gagttattta ttatataaat ttcgtaattt agatagaaaa gaagaaaatg taatattttt 6960attgtagagt gttatgtgtt attgaaagag aaaaattata gtttaatttt ttttataagt 7020agattgaagg tttgtacgta ttatggaatt tgataaataa ttagtttaat atttacgtat 7080tgattatttt ttaagaaaaa tatatgattt aaaataaaat tagtaattag ttgttagata 7140atttttgttg tgatgaatgt attgttattt tttaaatggt tttttttttt ttaagagtgg 7200aattttaaaa gtttggtaat ataatttagg aattgggtaa tttatatagt gaaaattttt 7260tcgaatttta ataagaaatg gatttattta gttgaacgtt gttttagata ttaagttttt 7320ggtaagtaat ttattttaaa agtttttatt attttttttg attttttttt ttcggtatat 7380tttgcggagt attcgttatt gtaattttta aagaagaatt aaattattat taagtaaatg 7440taggtgggta agcgggattc ggggtaattt acgtgacgtt tattatgata tcgtgcgttt 7500ttttttagga tttaggtaaa tataaaaaag gaggtttaga taattaagta tttaggttcg 7560aatttttaat aagcgtgttt tgggagcgtt gttttgtatt ttttattttg tcggggtcgc 7620ggcggttttt gttttttttc gtcggtttag ggaagattgg ttaaatttta ggttagtttt 7680atagagttag ggttcgtcgg taaagaataa aaaaataatt gtttttttta tattcgagta 7740aatagtttag attggggtgt taagttattt atagaaaaat ttttagggcg cgtttagttt 7800cgtggttttg ttaattatag acgtataata gtaagtttgt aaagggaacg gggacgggcg 7860tgaattattt tttttattag tagggttttt cgatgtcgta gtatttattt tatattttaa 7920attttatggt attagtgggt aatttaaaag ataaagatat agggaagcgg gattaattgg 7980gaaaatttgt agatatttgt tttaatgcgt aatttgttaa ataattacgg gggtgggggt 8040ggggaaggaa gagatttaag gaggtagaag gttgcggtta aaatattttg gggtggtaga 8100gttacgtagg atgtggttgt gggttttggt agtttagaga tttagttttc gttttttttt 8160ttagagcgag tttatagtta tttttacgtt tttcgtggcg gttttcgtta cgtttcggag 8220cgggttattt atgagggtgt tagatttggg tagcgggaat ttcgaagagg tggagattgt 8280aggttggatt ttagatttcg ggtagggatg cggggaaggg aagacgtttc gttggaggcg 8340gaatggaggg taaggcgaag gaggatggtg taggaaacgg cgataaggcg ttcggttagg 8400ttcgcgagtt atcgagattc gggttttaat tttttttttt ttcgtaaacg ttcgggttcg 8460aggtatttgg cgggtaaggg tcgtagcgga gcgaagcggg ttggttatgg ggaggttgcg 8520gggacgcggg gttgtagaga gcggtagtgg tacggagcgc gcggttggaa gcgaaagtag 8580gcggtgtggt taagtttcgg cgtacggttt atagggcgtt gggtattacg atttggggtc 8640gcgcgttagg gttaggcgta gggtacgacg taattttttt agtatttttt ggggaggagt 8700ttttaatcgt ttcgttttag tttgtttgta gtcgttaaaa tcgaagcggt tgtttttgtt 8760atcggggtcg tttgcggagg ttcgagaatg cgcgttacga acgagcgttt ttttaagcgt 8820agatatttcg cgagtatttt tgtttattaa ataattttta ggtgaatggt cgggaagcgt 8880ttttcggtta aggttaagga aatttcggag aaattatatt agggtagttt ttttatcgat 8940tttaaattta attgataaaa agtagttttt gttttcgaga gtttgcgggc ggggattgat 9000atttgtgcgt ttgtttttgt ttgttattga tcgttatgtg taaattgaag ggggagaacg 9060tgaatttagt ttttagattt ttttgcgtta tttatttaaa tcgaatttgt aattcggggt 9120gttatggggt tattaggttc gtatttttta agggttattt ttgtttaaag attttaatgt 9180tttttatcgt ttttaggtaa agtagattat taagagtttt aattatattg tttttatagt 9240ttttcgatgt aggttcgtga tcgtaatatt tagaaagagg attggaaaag tgatgttaga 9300agtattattc ggtttagaaa gggaaaggag gattggaata gttattgttt tatatgtagt 9360gttcgtttgg gcgtaacgtt agtttaaatt atgagttttt ttggttttta aattaatagg 9420aagtggtaat tggggttgat ttgattttgg aaagaggggg agggtagttt attttgggtg 9480aaagcggtta aattcggttt ggttttttaa atggttttat ataacgttat tgataatata 9540ttgtagtttt aattttatta atttagaaaa tttatatttt tttttttttt tatataaggt 9600atagaaaggt tttttacgtt ggggtggggt tttaagtttt aaagattata gagtttaggt 9660aggttacgta ttattataga gcggcgagtg tttttggaag tttagggtcg tttataagat 9720aagttttgtt tttgttgttt tgagacggag tttcgttttg tcgtttaggt tggagtgtag 9780tggcgcgatt tcgtttaatt gtaatattcg ttttttcggt ttaagtaatt tttttatttt 9840agttttttta gtagtcggga ttataggttt gcgttattac gtcgggttaa tttttgtatt 9900ttttgtagag atcgggtttt gttatgttgt ttaggttgtt tttaaatttt tggatttaag 9960ttatttattt attttagttt tttaaagtgt taggattata ggcgtgagtt acggcgttcg 10020gtttttattt gtattaattg tttttatttt ttttttatta agggtttttg tttaattatt 10080ttatttaaat aaggttttta atagttttta ttttgttttt gttaatggtt ttgtttttcg 10140tgtattttta tggttgtatt tatgtgttga tgatttttaa atatattttt ttagtttatt 10200tgttttttga gtagtaggta tttgttattt aaaaatttgt ttaaaataaa aacggtgtat 10260ttatttatta tgttcgaagt attgggttag ttgttggggg agggttgaga gtatattatt 10320attttgttat tatgtattgt ttttagttag agagaaaagt gttaattgtg ttagaaagtg 10380ttaaggaatt ttatagatag atgtaaaatt ataataagtg ttgtttgtgt tttaagagtt 10440tttaataatg gattgtattg atttagaaag gtttggaaag gtttttagta agtgattttt 10500gagtagaaat ttgaaagatt aaagaaattt attaaaggaa gaagggatga agagtatttg 10560gtatgaaagt gagttttagg ataaaagaat ttttttgagg agggttggaa taaagggtta 10620aaagagagtt tggggttgcg gtagatagaa gaggatggag tttgggttag tgagtagtta 10680aagggttagt taagtagtgt tttagggaga gttaaagaat aattttaaaa agtaaaaata 10740aggtaaaagt ttgattgtta tataggtata aaataaatta aattatagag tttatttaaa 10800ttatttaatg aagttattag gtagatataa aaattggttt aaagaatagg tatgtttata 10860ggttagaaat attgaaatga atatgtaaat gaaattggtt ttttttatag taggggagag 10920aagttaattg aattttgatt tttagatttt atttgtatga ttgtatgtaa taattatttt 10980gtatttttat tagttatttg taaaataatt taaaaataat gaaataatgt aagatttaat 11040gaaagggttt atggaattag aattagataa ttttaaaggt ttgttttaaa taatttagtt 11100ttttattgaa gtataaattt ttttttatag tacggtaata taattttttt atttaagaag 11160tgttattagt tagtaatagt tgaagtaaat tagatatagt agttattgta tttattagtt 11220atattaagaa gttgtagttt tagtagtttt taatttagtt taatttaggg gtaagagaaa 11280ttattgaaag gttaaggatt aggtggagta tgtaggagcg gtgatagaat tgaaggtatt 11340ggttgtagtt tggagattgg aagagggttt gggtggagag gaatggattt tgaagaagtt 11400attatagaat ttatatacga gatgattttt ttaataagtt agatttggtt ggtggttggt 11460aatagaagtg gagagaaata gttagatttt agtaagaatg gagataaggt ggtagtttgg 11520gtaatatggt aaaattttgt ttttggtaaa aatataaaaa ttagtcgggt tcggtggtat 11580gtgtttgtag ttttagttat ttacgggatt aaggtgagag gattatttga atttggtgag 11640gttgaggttg tagtgggtta ggattatatt attgtatttg tttgggtgat atagtgagat 11700attattttaa aaaaaaagaa aaagaaaaat agatgatata aggtgggata aggatgagag 11760aagtgttaag gaggtttttt tggatttgat ttgtttattt atttggtgat gtttattaag 11820aaaaaaggaa tgttgaaaaa gaatgtgttt gaggggatga ggaggagttt ggtttgggat 11880ttatgatttt tgaagtgttt ttaagattgg ttgtgagaga tttgtttgtt tgaagtttag 11940agaagaggtt tggattagag gtattattga attattggta tagaggtggt aattgaagtt 12000atgggtgcga aagagaattt ttatgttagt ttttttcgtt gtaaaatgag ataatagtaa 12060tattttatgt ttgttaattg ggatagatga gtattaatat atgaaattta tgtatattat 12120ttagaattat gtttgatgtt agttatgtag aataggtgaa agaacgggta tggttttgtt 12180tttattaaat tgtatttgaa aaacgggata gagtaaatgt ggtttgtgga ttgtaagttg 12240tttatttttg ttttatgtag ttgttttagt agaaatatag tagttgtttt ttaaatgtat 12300ttaagtgatg attattaatg tttatttatt tttgttttaa atattttgat agttgttatt 12360tttttaatta tgttattcgt attttagtat taaatagttt ttaagtagt 12409 9 6013 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 9ttattgtatt ttagttttga cgatagagcg agattttgtt ttaaaaaaaa aaaaagaaaa 60aaaaaaattg ttttagagat aggaagggat tttttcgaag ttataagtag attagaggaa 120gttggtttaa ggaggtttat ttagatgtta aatttttaag gatagggttt cgggttttat 180atgttttttt ggtttttttt tattttattt tattttttat atatgttttt tatttagttt 240tgtatggtta gtgtgaggaa tagttttacg ggtaaagata gcgaatgttt tatgtttgtt 300tttagtgaaa atatagggtt cggggtttcg aaaattgtat atttttttga tgtggtagga 360aaataagatt gatcgtatag ggtttttaag atttttgaat tatttttaag agagtggttt 420ttttattttg agtaggtagg tagagatgtt tagtgcgggt tgagtatgga gttttttttt 480tagagtttgt agggcgagta tagtttttat ttaagtaagg gagtttgcgt ttttgtttgt 540tttttattag tgaaaaatat atttatttta tgttatcgtt ttagtagaaa aattaaagat 600gatggatgtg tagggtattt tttaagtaga agaggtgtta gtgtgagtta ttattcgttg 660tatgttttga tgcgacgtta tgggatagtt agaagttatt tgtggtttgt tgttgggtgt 720taattagggg ataggttgtt agggttggag gtgtgtaatt taggaaggag aggggttgta 780agtttttttt taaggaatta gggttttatc ggagttttga ggatgttttc gttaagtttt 840tgaggtgagt agggaatggg tttttttcgg tgacgtgttt ttagtgttta gtttaaatag 900tagttttagt aaatttgaac gtattatggt tttttgcggt tttttagatg aagtttgtat 960tttttatttt gatttttgtt tttgattttt ggggtttttt gtttttagaa tttattaagg 1020tttttttttt ttcgggtttt tgtaggtttt taggattgta ttttaaaagt taatttaagt 1080tttttttttt tttttttttt tattatagag attagtaaaa ttttaagatt tgattttttg 1140ggggttaggc gttgtggttt acgtttgtaa ttttagtatt ttgggaggat gaggtaggtg 1200gattatttga ggttaggaga ttaagattag tttggttaat atggtgaaat tttattttta 1260ttaaaaatat aaaaaattag ttaggtatgg tggtaggggt ttataatttt agttatttag 1320gaggttgagg taggagaatt atttgaattc gggaggtaga agttgtagtg agtcgagatt 1380gtattattgt attttagttt gggtaataaa agtaaaattt tattttaaaa ataaaataaa 1440taaataaaag aaaatttcga ttttttaagt ttttttgttg tttaaggtgg ttatgtaatt 1500tagatttagt tagtaagtta gaataaaagt ttttgaggag taattttttt tttgaataaa 1560gagatggagt tggtaaggaa aaggtttttt tattttttgt ttttcggttt tttgtttttt 1620tttttttttt ttgtttggaa tatggatgtg aggttcggag gtgtcgtagt tattttgtga 1680ttatgaggta gtaattgtga ggatatagtt tttatattga agatagtgaa agggaagata 1740gagtaggggt ggtcgtgtta tttgtaagtt attatattaa ttcgattatt tatcgaaggt 1800ttattattgg ttaaagtaaa attttttgtt tgtataagtt tttgtattag tagttttttt 1860atttataatg aacgtaatat ttatgttata tagttagttt tttacgagga atttttgtag 1920aatttgtatt tttatttttt ttggggttta ttgcgtgttc gttattgcgt tggttttttt 1980tagttttttg attatattga atttattttt gttttaggat ttttgtattg gttgggtcgg 2040ttagaggttg ttggtttttt tttattattt tggcggtttt agtttaaatt ttacgttttg 2100aaaaacgttt tttttttttg tcgtataatt tgtaggagtt tttttaggtt tttttatttt 2160atgagtcggt tttttttttt tattattttt tattgttgtt tgttgttttt tttatttgtt 2220tttttatttg tttggtgtat agaacggtag ttttataggg agttcggttg tttgtgttga 2280gtgtttttgt gtttttagtg tgtggtatat agtaagtatt taataaaggt ttgttggatg 2340aattatttag tgtttttttt gtttgttttg ttttggagat agagtttcgt ttttgttatt 2400tagacgagtg tagtttcgcg attttggttt attgtaattt ttgtttttta ggtttaagtt 2460atttttttgt tttagttttt taagtagttg ggattatagg tatttattat tacgttcggt 2520taattttttg tatttttagt agagatgggg ttttattatg ttggttaggt tggttttaaa 2580gttttgattt taggtgattt attcgttttg gttttttaaa gtgttgggat tataggcgtg 2640agttattagg ttcggttatt tatttagtgt attaattaat gttaattttt ttgttgatgt 2700gttttgtttt tttgtttggg agttggaaat ttttattttt ttttttgagt tgtttttttt 2760gggaaagttt ttttggtatt tttagatttg ggttgggata tttgtggttt tcgtatttat 2820gattttaggt gtttttttgt cgttattttt ttataatttt aattgtaagg tggttgacgt 2880ttttatttgt tagatgttat tttttttttt aggttataaa ttttaagagg atagggatta 2940ttttcgtttt ttgttttatg gtttatgttt ggcgtaggtc gatgtgtttg ttgaatgaat 3000gaatgatagt agttgttttt agattggaag attttaggtt agacgatagg agttatttaa 3060gttttatttt tttttatttt agttcgtttt ttttttcgga agaaaaatta aattaaagtc 3120gcgtgtttta tttagtttag atttgttttg ttttgaataa aggggtagtt ggtgtttttg 3180tttagataga cgtttgtatt agtaatacgt aaagttagtt ttgtcgcgta gttcgagggt 3240ttcggggggt tgttttttag taagattttg tttttttttt tttattttat ttttttattt 3300attttttttt ttaaataata gtatatattt ttaattttcg tgtggaattt ttcgttttta 3360aagtattttt taagtattag tttattagta gagcggtttt ttgatattac gaggttgttt 3420tttgggtgtt ttttgagtta taacgttcga gtttatcgat aaaaataagt tttttttata 3480gagcggattc ggcgttatag ttaagattat tgttttagaa aaaaagggaa gaaggaagga 3540gagaaatatt gtttttggta agcgttagtt aagtattgat tttcgtgtta gttttaagta 3600ttaggagatt cgagagatgt taggtttagc gtaggggtta tcgaagtttt cgttttttgt 3660tttgggttgg aattttttat taggaggaga tgttatagcg tggtttttga tatttggtat 3720tttttttagc gttttttttt gtatttatat ttggtttttt attattagga atgtttttcg 3780ttttttattt tatttttatt tcgtaaatat agttataagt tttaagttta gaggacggga 3840taattatttg ttgtttaata aatgacgggt ggtgttagtt agttcggata gagggtagtt 3900attttggtat tgaatagatt tgggtttaaa ttttagattt gttttttata agttttggga 3960ttttggttaa gtggtcgaga ttgttttttc gtttgtggaa tgaggtcgta ttggttttgt 4020tttttttagg gtcgtttgtg aaatgatgag tggagagtat tggggtattt ggagttagcg 4080atgtttttag ttaagggagt agttgttaat ttttttggtt ttaggggtta tagagtggtt 4140tttattttag aggtagagta taggttttag ggtaggggat ttagtattgg gtattacgga 4200agtttttata agagttaggg aggatcgtgg tttttttttt gtaggagggg ttggttttag 4260tatttttgtt tttgtatttt atattatttt atttatagaa gaggtattga ataaagattt 4320aaattaaaag ttttatgtaa attaatataa aagttggatt gggttatata tagtggttta 4380taattgtaat tttagtattt tgggaggtta aggcggagga ttatttgacg ttaagagttt 4440gagattagtt tcgttaaata tggtaagatt tgtttataaa aaatttattt ttttgttttg 4500tttttgtgag acggagtttt agttttgttg tttaggttgg agtgtaatgg tgagattttg 4560gtttattgta atttttgttt tttgggttta agcgattttt ttgttttagt tttttgagta 4620gttgggatta taggcgttcg ttattacgtt tagttaattt tttgtatttt tagtagagat 4680gtggttttat tatgttggtt agattggttt tgaatttttg attttaagtg atttatttat 4740tttggttttt taaagtgttg ggattataag tatgaattaa tatatttagt ttttataaaa 4800attttaaaaa ttagttaagt atggtggtat gtacgtgtgg ttttagttat ttaagagatg 4860ggaagattgt ttgagtcggg gaggacgagg ttgtagtgag ttatgatgac gttattgtat 4920tttgttttag tttgggtaat atagtaagat tttgttttta aaaaaagaaa agaaaagaaa 4980atggttgggt gtagtggttt acgtttgtta ttttagtatt ttgggaggtt aatatgggtg 5040gattataggg ttaggagttc gagattagtt tgattaatat ggtgaaattt cgtttttatt 5100aaaaatataa aaattagtcg ggcgtggtgg tggtatgtgt ttatagtttt agttatttag 5160gaggttgaga taggagaatc gtttgaattc gggaggcgga ggttgtagtg agttaagatt 5220ttattattgt tttttagttt gggcgataga gtgagatttt gttttaaaag aaaggaaaga 5280aggaaggaag gaaggaaggg agggacggat agatagaggg agggagagag gaaggaaaga 5340gaaaggttag gtgcggtggt ttatatttgt aattttagta ttttaggagg ttaaggtagg 5400cggattattt gaggttagga gttcgagatt agtttggtta gtatggcgaa attttgtttt 5460tattaaaaat ataaaaatta gttaggtgtg ttggcgtgaa tttgtagttt tagttattta 5520ggaggttgaa gtaggagaat cgtttgaatt taggaggagg aggttgtagt gagttaagat 5580tatgttattg tattttagtt tgggtaatag agtgagattg ttttagaaaa taataataat 5640aaataaaata aataaatata atgtaaaaaa atttttaaag ttggtttggg ttatggaaaa 5700tgtattagaa atattattat ttagaaattt tttttttgag ttatagtaaa tattgattgg 5760atttttatta cgtattaggt attgtgttgg gtataggata ttttttttgg agatggtagg 5820agattgttgg gtattttttt agggtatatg ttagtaatat tttatttcgt gttttagtaa 5880aaaggtttaa atgtatgtgg ttaagtagat gtgggtgcgt tttgagggta gaaattttgt 5940tcgttgagta agaacgttgt tggatagttc ggtgtttatt ttgtttttag ttattttttt 6000aatagaattt tgt 6013 10 6013 DNA Artificial Sequence chemically treatedgenomic DNA (Homo sapiens) 10 atagggtttt gttaggaagg tagttggggataaaatggat atcgaattgt ttagtagcgt 60 ttttatttag cgaatagggt ttttgtttttaaggcgtatt tatatttgtt tggttatata 120 tatttggatt tttttgttgg agtacgaagtaggatgttgt tggtatgtgt tttggaggga 180 tgtttagtag ttttttatta tttttagagggagtgttttg tgtttagtat agtgtttggt 240 gcgtggtagg ggtttaatta atatttgttgtgatttaagg gaggagtttt tagatagtag 300 tgtttttggt gtatttttta tgatttagattagttttaaa aatttttttg tattgtattt 360 atttatttta tttattatta ttattttttgagatagtttt attttgttgt ttaggttgga 420 atatagtggt atgattttgg tttattgtagtttttttttt ttgggtttaa gcgatttttt 480 tgttttaatt ttttgagtag ttgggattataggtttacgt taatatattt ggttaatttt 540 tatgttttta gtagagatag ggtttcgttatgttggttag gttggtttcg aatttttgat 600 tttaagtgat tcgtttgttt tggttttttaaagtgttggg attataggtg tgagttatcg 660 tatttggttt tttttttttt tttttttttttttttttttg tttgttcgtt tttttttttt 720 tttttttttt tttttttttt ttttttttgagatagagttt tattttgtcg tttaggttgg 780 agggtagtgg tgagattttg gtttattgtaattttcgttt ttcgggttta agcgattttt 840 ttgttttagt tttttgagtg gttgggattataagtatatg ttattattac gttcggttaa 900 tttttgtatt tttagtagag acggggttttattatgttgg ttaggttgat ttcgaatttt 960 tgattttgtg atttatttat gttggttttttaaagtgtta ggatgatagg cgtgagttat 1020 tgtatttagt tatttttttt ttttttttttttttagagat agggttttgt tgtgttgttt 1080 aggttggagt agagtgtagt ggcgttattatggtttattg tagtttcgtt tttttcggtt 1140 taggtaattt ttttattttt tgagtagttgggattatacg tgtatgttat tatgtttggt 1200 taatttttaa aatttttgta ggggttgggtgtgttggttt atgtttgtaa ttttagtatt 1260 ttgggaggtt aaggtgggtg gattatttaaggttaggagt ttaagattag tttggttaat 1320 atggtgaaat tatattttta ttgaaaatataaaaaattag ttgggcgtgg tggcgggcgt 1380 ttgtagtttt agttgtttag gaggttgaggtaggagaatc gtttgaattt aggaggtaga 1440 ggttgtagtg agttaagatt ttattattgtattttagttt gggtaataag attgaaattt 1500 cgttttataa aaataaaata aaaaaataaattttttgtag atagattttg ttatgtttgg 1560 cgaggttggt tttaaatttt tggcgttaagtgatttttcg ttttggtttt ttaaagtgtt 1620 gggattatag ttatgagtta ttatgtatggtttagtttag tttttgtatt ggtttatatg 1680 aggtttttag tttggatttt tatttaatgttttttttgtg gatgagatgg tgtggggtat 1740 agaggtaggg gtgttaagat tagttttttttgtagggaga aggttacgat tttttttgat 1800 ttttgtgggg gttttcgtaa tgtttagtattgagtttttt attttgggat ttgtgttttg 1860 tttttggaat ggaagttatt ttgtaatttttaaaattaga gaaattggta gttgtttttt 1920 tggttgagaa tatcgttgat tttaagtgttttagtgtttt ttatttatta ttttatagac 1980 gattttgagg gaggtagggt tagtgcggttttattttata gacgaggaaa tagtttcggt 2040 tatttggtta aggttttaga gtttgtaaggagtagatttg ggatttgaat ttaggtttgt 2100 ttaatgttag agtaattgtt ttttgttcgggttggttgat attattcgtt atttattagg 2160 tagtaaatgg ttatttcgtt ttttgggtttagggtttatg gttgtgtttg cggggtgggg 2220 atggagtggg aggcgggaaa tatttttagtggtgggaaat tagatgtggg tgtagggaga 2280 gacgttggga gaggtgttag gtgttaggggttacgttgtg atattttttt ttggtggagg 2340 gttttagttt agggtagggg acggaagtttcggtggtttt tacgttgagt ttggtatttt 2400 tcgggttttt tagtgtttag agttgatacggggattagtg tttggttggc gtttgttaga 2460 ggtagtgttt tttttttttt tttttttttttttttttgag atagtgattt tggttgtggc 2520 gtcgaattcg ttttatggga aaaatttgtttttgtcggta aattcgagcg ttatgattta 2580 gaagatattt agggagtagt ttcgtggtgttaaggggtcg ttttgttaat gagttaatgt 2640 ttaggaagtg ttttgaagac gaaaaattttatacgagggt tgagggtgtg tgttgttatt 2700 tgggggagag ggtgaatagg aggatgaagtggagggaaag gggtaaaatt ttgttaagga 2760 atagtttttc gagattttcg ggttgcgcggtaaggttggt tttgcgtgtt gttgatgtag 2820 gcgtttgttt gggtagaggt attagttgtttttttgttta gaataaggta gatttgaatt 2880 gggtgggata cgcggttttg atttagtttttttttcgggg gagggggcgg gttggggtgg 2940 gaagggatgg gatttgggtg atttttgtcgtttagtttga gattttttag tttggaagta 3000 gttgttgtta tttatttatt taataaatatatcgatttgc gttaggtatg ggttatggag 3060 taggaaacga agatagtttt tgtttttttgaagtttatgg tttggagggg gagatgatat 3120 ttaatagatg aagacgttaa ttattttgtagttagaattg tgaaagggtg gcggtagaga 3180 gatatttaaa gttatgggtg cgggaattatagatgtttta gtttaggttt gggagtgtta 3240 ggaaggtttt tttaggagga atagtttaaaggaaagagtg ggggttttta gtttttaggt 3300 agagagatag gatatattag tagagagattggtattaatt aatatattga ataaatggtc 3360 gggtttggta gtttacgttt gtaattttagtattttggga ggttaaggcg ggtgggttat 3420 ttggggttag gattttgaga ttagtttggttaatatgatg aaattttatt tttattaaaa 3480 atataaaaaa ttagtcgggc gtggtggtgggtgtttgtaa ttttagttat ttgagaggtt 3540 gaggtaggag aatagtttga atttgggagatagaggttgt agtgagttaa gatcgcggga 3600 ttgtattcgt ttgggtgata aaagcgaaattttgttttta aaataaaata aataaaaaag 3660 atattgaata atttatttag taaatttttattgagtattt attatatgtt atatattggg 3720 gatatagagg tatttaatat aggtagtcggattttttatg gagttgtcgt tttgtgtatt 3780 aagtagatga agaagtaggt agagaaagtagtagatagta gtaaggagtg gtggggaaaa 3840 gaaatcgatt tatggggtag aggggtttggggaggttttt atagattgtg cggtagagag 3900 ggaaggcgtt ttttaggacg tggggtttaaattgagatcg ttagagtggt aaggaagagt 3960 tagtagtttt tagtcggttt agttagtgtaaaggttttga gataggaata agtttagtgt 4020 gattagagaa ttaagagagg ttagcgtagtggcgggtacg tagtgagttt taaggagagt 4080 gagaatgtaa gttttgtagg ggtttttcgtgaagggttgg ttgtgtagta taagtattac 4140 gtttattgta aataaagaaa ttattaatataggggtttat atagatagaa gattttgttt 4200 tagttaatga taagttttcg gtgggtagtcgggttggtgt agtaatttat agatggtacg 4260 gttatttttg ttttattttt ttttttattgtttttagtgt ggaggttgtg tttttatagt 4320 tgttgtttta tggttataag atggttgcggtattttcggg ttttatattt atgttttagg 4380 taagaggaag gagaaggagt aaaaggtcgaagagtaaaga gtgagagggt tttttttttg 4440 ttagttttat ttttttattt agaaagggaattgtttttta gggatttttg ttttaattta 4500 ttggttagat ttgggttata tggttattttggatagtaag gaggtttgga aaatcgaggt 4560 ttttttttgt ttgtttgttt tgtttttgagatggagtttt gtttttgttg tttaggttgg 4620 aatgtaatgg tgtaatttcg gtttattgtaatttttgttt ttcgggttta agtgattttt 4680 ttgttttagt tttttgagta gttgggattatgggtttttg ttattatgtt tggttaattt 4740 tttatatttt tagtagagat ggggttttattatattggtt aggttggttt tgattttttg 4800 attttaggtg atttatttgt tttatttttttaaagtgttg ggattatagg cgtgagttat 4860 agcgtttggt ttttagaaaa ttaagttttaaaattttgtt ggtttttata gtagaaggag 4920 gaaagggaga agagtttggg ttgatttttggggtgtaatt ttaaaggttt gtaaaggttc 4980 gaaggaggga aggttttggt gaattttggggatagaaagt tttaggggtt aggggtaggg 5040 gttagggtga agagtgtaga ttttatttggaggatcgtag ggagttatgg tgcgtttaga 5100 tttgttgaag ttgttattta aattgagtattggagatacg ttatcgaggg aggtttattt 5160 tttgtttatt ttagagattt gacgggggtatttttagggt ttcgatgaag ttttgatttt 5220 ttggagaaag gtttgtagtt ttttttttttttggattgta tatttttagt tttggtagtt 5280 tgttttttgg ttggtattta gtagtaggttatagatggtt tttggttgtt ttatggcgtc 5340 gtattagggt atgtagcgga tagtgatttatattggtatt ttttttgttt ggaaaatgtt 5400 ttatatattt attatttttg gtttttttgttagaacgatg gtatgaggtg ggtgtatttt 5460 ttattgatgg ggaataggta gagacgtaagtttttttgtt tgaatgagga ttgtgttcgt 5520 tttgtagatt ttggaagaag ggttttatgtttagttcgta ttgggtattt ttgtttgttt 5580 gtttagggta gaagggttat ttttttagggatgatttaag ggttttggag gttttatgcg 5640 gttaattttg tttttttgtt atattaagggagtgtgtaat tttcgaggtt tcgagttttg 5700 tgtttttatt gagggtagat atagggtattcgttgttttt gttcgtggag ttgtttttta 5760 tattaattat gtagggttgg gtgggagatatgtatggggg gtggggtggg gtgggagggg 5820 gttaagaaga tatgtaagat tcggggttttgtttttggga gtttaatatt tgggtgggtt 5880 tttttggatt aatttttttt gatttgtttgtgatttcggg aaagtttttt tttgtttttg 5940 ggataatttt tttttttttt tttttttttttgagatagag tttcgttttg tcgttaaggt 6000 tggagtgtag tgg 6013 11 12951 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 11tttttttttt tggtgaggtg agtttttgtt atttaggttg gagtatagcg gtgtgatttc 60ggtttatcgt aatttttgtt ttttgggttt aagttatttt tttgttttag ttttttgagt 120agttggtatt ataggtatgt attataatat ttagttaaat ttttttgtat ttttagtaga 180gatgagtttt gttatattgg ttaggttggt tttgaatttt tgattttaag tgatttattc 240gtttcggttt tttaaagtgt tgggattata ggcgtgagtt acggtattag gtttagttta 300gtttttttac gtttttttgt ttgttttata ttttggtcgt attggtagtt gattagttgg 360tgtttattta gattgaggat gggttcgttt tttttagttt tattgattta aatgtttatt 420ttttttggta acgtttttat agatatattt aggattaata ttttgtattt tttaatttaa 480ttaagttgat atttattatt aattattata aggtgtgagt tttgtattta gtaatatatt 540gttttttata tatttataga aatttaattg gttttgtttt tttggaaaat tttgattaat 600atatattttt ttattttttt tatagtattg aattatggga taaattaggt tggttgtttt 660gtagaatgtt ttatattgtg atttgattga tattttttta tgattttaat ttttattttt 720tgtgtttttt aattaattta tttgggtttt tgtttttttt ttttgttttt agatagggtg 780ttattgtgtt gtttaggttg gagtgtagtg gtatagttat agtttattat agcgtcgatt 840ttttaggttt agatgattta tttattttag ttttttgagt agttggattt ataggtgtat 900attattatat ttagttaatt tttaattttt ttagagatgg tagaggtggg gggggttggg 960gggggtttta ttatgttgtt taggttggtt ttgaattttt gggtttaagc gatttttttg 1020ttttggtttt ttaaagtgtt gggattatag gtataagtta tcgtatttgg ttttaaataa 1080tttatttttt ttattttttt agtttttgtt tttatttaat tttttatttt tattttagtt 1140tttttaggaa tttgagtttt tggatttttt tatttttttt ttgttaataa gtttttttat 1200aatgttcgtt attattttaa ttattttatt ttttaaaaat ggattttgtt gaggaataat 1260atgtatataa taaaatgttt gtatttaaaa tgtatttttt agcggatttt aataaatata 1320tatatttgtg taattatcgt tattattaag tcgttttttt ttttatagtt tttattttgt 1380ttttttttat tatgtttttt taatttatat taatttttta gatttttttt tttttggtac 1440gtttggttgt agatttgtag gagagaatat atacgtcgat ttgttggaaa tttgtatatt 1500agtattgttt tttcgaggat tttcggtttt tgtttaggta gtagtgttcg tttatgtttt 1560atagtagttt tttttttttt tttttttttt gagatggagt ttcgtttttg ttgtttaggt 1620tggagtgtag tggtataatt ttagtttatt gtaatttttg ttttttgaat ttaagcgatt 1680ttcgtgtttt agtttttcga gtagttggga ttggaggcgt ttattattat atttagttta 1740tgtttttgta tttttagtgg agacggggtt ttattatatt ggttaggttg gtttttaatt 1800tttgagttta agtgatttat tcgttttagt tttttaaagt gttgggatta taggtttgag 1860ttattgtgtt cggttagtaa gttttttttt tttttttgag ataggatttt tttttgttgt 1920ttaggttgga gtgtagtggt atgattttgg tttattgtta ttttaaatgt ttgtttttat 1980tattgtgtag taataaattt ggttaggagt ggtggtatat atttgtaatt ttagtatttt 2040gggagattaa agcgggagga ttatatgagt ttaggagttt gagattagtt tgggtaatat 2100agtgagattt tatttttatt aaaaaaataa aaaaaaatta gttaggtacg gtggtatgta 2160tttgttattt tagttattta ggaggttggg gtaggaggat tgtttgagtt taagagtttg 2220agaaaagttt gagtaataaa gtgagatttt atttgataaa atagtataaa aggacgtttt 2280aaaaaagggt taggtaggta gttttgttta atagaatttt ttttatttgt gttgtttaag 2340taaggtagtt ataagtttta agtagttatt gagtattgga aatgtggtta gtagttaggc 2400gtggtggtag gcgtttgtgt tttagttatt taggatttga ggtaaaaaga tcgtttgagt 2460ttaggaattt aaggtcgtag tggtggattt aataaaagaa aaaaaggtcg aggttgtagt 2520gaattattat tatgtttttg agtttttaaa ttttaaatga taggagtgtt tattttattt 2580attgtgggtt ttttagatta tttttgatgg tttatgttaa tgagatgatt tgggatgggt 2640ttttatatag tttatgttaa taagatgatt gaggatggga attggttatg ttggaaatta 2700acgatcgaat acgatatttg agttttgtgg ttttgagttt tatttttgga tgggttaggg 2760agattggtga ttgagaaaat aattttatta gaagagtgag agatagaata gttagtatat 2820tgcggtttcg atttgaatta gtttaggttt ttttaaatat tagtgatatg tggttattta 2880aatttaatta aagttaggcg tagtggtata tgtttgtaat tttagtattt tgggaggtcg 2940aggtgggtag attatttgag gttaggagtt tgagattagt ttggttaata tggtgaaatt 3000tatttttacg aataatataa aaagtggttg attgtggtgg tgtatgttcg tagttttagt 3060tatttaggaa gttgaggtat aagaattgtt taaatttagg agatggagat tgtagtgagt 3120taagattttg ttattgtatt ttagtttggg cgatatagtg aaatttcgtt ttaaaaaata 3180aatttttaaa aaattaattt aattataatt aaaattttat ttttttagtt tattggttat 3240tttttttttt ttaattttta tttttttttt tttattgagt ttattattgc ggttttgaat 3300ttttgggttt aagcgatttt tttgttttag attttgagta gttgggatat aggcgtttgt 3360tattacgttt ggttgttggt tatattttta gtgtttaata gttatttgaa gtttgtggtt 3420attttatttg ggtagtatag atagggaaag ttttattgga tagggttgtt tatttagttt 3480ttttttaaaa cgttttttta tattattttg ttagatgggg ttttattttg ttgtttaggt 3540tttttttaaa tttttgggtt taagtgattt ttttgtttta gttttttaaa gtaatttgta 3600aatacgtgta aataatatag tttttttttg ttgtattaaa atgaatgtaa aaatgttacg 3660atggggtcgg gcgcggtggt ttatgtttgt aattttagta tttcgggagg tcgaggcggt 3720aggattattt gaggtcggga gttggaaatt agttttttgg tgttttttta atttttgtat 3780tggagggata acggaagggt tttgtgttat ttttattttt tttatttgta atttttttga 3840tggttaatta ttattttaaa gttttagttt tttttttttt atttattgag agtatatttt 3900tttttttata gtaattttta ttttatagag ttttttttga gacggagttt tatttcgtta 3960tttaggcggg agtgtagtgg tacgatttcg atttattgta attttcgttt ttcgggttta 4020agcgattttt ttgttttagt ttttcgagta gttgggattt ataggcgttc gttattacgt 4080ttagttaatt ttttagtata gacggggttt tattaggttg gttaggttgg tttcgaattt 4140ttgattttag gtgatttatt tatttcggtt ttttatattg ttgggattat aggcgtgagt 4200tatcgcgttt ggtttcgttt tggttatttt ttaatatgtt tttttataat tgttattttt 4260atattagttt tgttttagtt tatgggaaat aaaattaatt agttttttta ttatttgttt 4320tgaggagtag gggtggtgta gtggtatgta tttagggaag tgtgttgtat gggtttttaa 4380gtgtagaatt tgaattttgt aaaggaagaa ataaattcgt ttttacggag tatgtttttt 4440taggattttt agttttttaa attcgtagtt atagtgattt agtagaattt gagtttaggg 4500tattatagta attcgtattc ggtttttttt ttgttttatt tcgtgttaag gttaaaaggg 4560tatgtttatt tgatttttgg atttttttgg gacgattttt attttgtatt tttttgtatt 4620ttagggtata gtgcgtagat gggtttgttt tagtattttt agttagattt ttgaggtttt 4680tgttatatat atttttataa tttttttttt tagtttcgag agattttttt tgatttttat 4740tagttgtttc ggcgggtgag agtggagagg tttttttttt attttttagg tttttttttt 4800ttttggagtt gtagttttag tatttttcgt ttagtatttt aggatttagg cgttgggttt 4860cgtttttgta ggttgtttat tttaaacggg tcggatagga tatataagag agaatgtatc 4920gtgtattata tacgcgattt ttataaggtt gtagtcggag tcgtttagtt tatcgagagt 4980ttagtttcgg ttagggtcgt ttcggtaatt acgagtttag ttaattagcg tttcggattg 5040tattagagtt atggtcggtg agtgttgtaa agggcggggt gtttggcggt cgtttttcga 5100gtattggtgt ttgtggagga ggttgtaggg gtttggtttt gaattttgtt ttttgattta 5160aaatttataa agggaagaga ttagggattt gggatgagtt ttgatcggat ttcgggagaa 5220ggagagtttt tgtttgtatt cggtgtcgcg gatttttttt tattttattt tacgaatttt 5280agtgggtatt taggagaaat ttgattttgg aagtagaaat tttttttaaa attgtggtta 5340gaaattggtc gttagaggtt aaattaggtt tacggttata gtttatattt tttttggttt 5400atagtattta aaatattttg aaataagttg ttaatattaa aatgggtgat tttatttaaa 5460aatgtggatt tcgagttttt gaagaaaatg agaatatttg gcgattggtg gataggagtg 5520gaggaaattg atgtttttgg tttgacggag attagaatcg gttttaggtt gttaggtata 5580ggttttgttt tgttttgttt tgttttgttt gagacggagt tttgtttttg tcgtttaggt 5640tgtagtgtaa tggcgttatt ttagtttagc gaaattttcg tttttcgggt ttaagcgatt 5700tttttatttt agtttttcga gtagttggga ttataggagt gcgttattat gcgcggttaa 5760tttttatatt tttagtagag acgggtttcg ttaagttggt tagcgcggtt ttgaattttt 5820gattttaggt gatttattta ttttagtttt tttaagtgtt gagattattg acgtgagtta 5880tcgtgtttgg ttttgggagg tattttttat tgaggttttt ggattaggta aatttgatta 5940gatcgtattg gattcgtttt tagtattggg tttattttag tgatagagtt tttttattcg 6000gttatcgatt ttaggggaat ttagaggtta ttttagtttt atttaaggta taaataatta 6060gttgagataa ttgtagggat tgagagttgt tttttaaata attttatttt gagattggat 6120agtattaaga tttagaaagt tgttgtttta tttggggtag aattttgcgt tttgtaattt 6180ttttttttgt ggatttggtt ttgtttttaa aaatgcgttt gtatataaag aagtttattt 6240tggttaaagt gagtggagga atagattgtt tttgtagttg ataaattgaa attattagga 6300tttttgagaa agggattaag ttggggattg gtagtttagt atgagttatt ggtagagata 6360gtagggaata gattttgata gttgagaggt ttgtcgtata tacggtggtt gttgtttttt 6420ttgtgtttta ttttttagcg tcgaggtatt ggtatttttt tttttaatat tagggtagga 6480attatttttt gattttttaa ttttatagaa tgttttgtat ttacgtgtag tttaaatata 6540aaaaagggcg gtggtaatga ggtgaaaagg gaagatttgg attttgtata attagtttta 6600gttgtattta gttaattaaa ttttgaggtt aattaaagta tttaggattt ttgtttgtaa 6660ttaatagatg tatttgattt gtatttatgt tttttggagt atttaagtga gaagagaagg 6720tagaaggaga atgtatgaaa ttgatataaa ggtttatttt tattatattt tttttttttt 6780ttttgagata gggttttgtt ttgttgttta ggttggagtg tagtggtatg attagggttt 6840attttagttt tgattttttg ggtttaagtg attgttttat ttttgttttc gagtagttgg 6900gattataggt gtgtgttatt atatttagtt aatttttttt ggttagagta gaagaatttg 6960aaatttagtt aattaaaaaa aaaaaaaatt ttggttggga gtggtggttt atttttgtaa 7020ttttagtatt tttgggaggt tgaggcggga ggattgtttg aggttaggag tttaagatta 7080agatttagtt taaatggtaa gtttttttga gggttttttc gaatgggtta gttttgaggt 7140tttgaagttt ttttttgttg aattttttga gatggagttt tatttatttt gttgtttagg 7200ttgtagtgta gtggcgtgat tttggtttat tgtaattttt attttttagg tttaaacgat 7260ttttgtgttg tagtttttta agtagttggg attataggcg tttattatta cgtttagtta 7320attgtgtatt tttagtagag acggggtttt attatgttgg ttaggttggt ttttagtttt 7380tgattttaag taatttattc gtttcggttt tttaaagtgt tacgattata ggtatgagtt 7440attatattta gttttttgtt gaattttgtt ttttattttt tttaatatat taatgttatt 7500gtattttgaa gaggttattc gtgtgtgtat tttgtggttt tttttagggt aaattttaat 7560agtttaattt tttttaggtt atgttgttta gttagttaag tggtaggaag ggaaaatgaa 7620ttttttaggg tttagaaaat ttttaaattg tttatttata agtatttttt tgtttgtttg 7680tttgagatag aggtttgttt tgttgtatag gttggagtgt aatggtgcga tttcggttta 7740ttgtaatttt cgttttttgg atttaagtaa tttttttgtt ttagtttttc gattagttgg 7800gattataggt atttgttatt atatttggtt aatttttttt tgtattttta gtagagacgg 7860ggttttatta tgttaattag gttggttttt aatttttgat atgaggtgat ttgttcgttt 7920tagtttttta aagtgttgag attataggtg tgagttatcg cgatttattt ataatttttt 7980tttgattatt ttttttttga gttgttttgg ggatttattt attttaggta ttgtattttg 8040atggttatat ttgttgtaaa tatattattt ttgtttgtgt gttgttttat atgaaaaatt 8100gtaaagttat aggtttgttt atagttatta gagtttgagt tttttgaaag agtaagagat 8160ggatattttg atttgtttat tttttgagaa gtgttttgat tgttttatta tttagaaaat 8220gtttgttaat attgatgaga agttaataaa ataaaaattg ttggttgggc gttgtggttt 8280acgtttgtaa ttttagtagt ttgggaggtc gagataggcg gattacgagg ttaggaaatc 8340gagattattt tggttaatac ggtgaaattt cgtttttatt aaaaatataa ttagtcgggc 8400gtggcggcga gcgtttgtaa ttttagttat tcgggaggtt gaggtaggag aatggcgtga 8460atttgggagg cggagtttgt agtgagtcga gatcgcgtta ttgtatttta gtttgggcga 8520tagagcgaaa ttttgtttta aaaaaataaa taaataaaaa ttgttagagc ggcgattagt 8580aaatattgat aagattaatg gtaaggtaag ttataaagaa aatgtttgtt agagttgaat 8640atgtttattt tttttttaat tatgttaaat ttatgggtta aagaggtagg aatttgttga 8700ggtagtttta gagttttttt tttttttttt taagttattt taagtaagtt aattattttt 8760agcgtattga aattattatt agatatttat tttattgagt tttagtttta agagtttaaa 8820attttaggat taagtttgga aattttttgg tttggtatat tgggttttga aagttatatt 8880tcgttgaatt tagtttaaga ggtatttgtt ttgttagatg tggttaataa taaaagtagg 8940aagagagttt aaggtttaaa tgtgtttttt tagttatttt agttattttt agttatttag 9000atggtgtaaa aaagttgtag atgtcggttg ggcgcggtgg tttacgtttg taattttagt 9060attttgggag gttaaggtag gtgggttatg aggttaggat atcgagatta ttttggttaa 9120tatggtgttt ttattaaaat aaaaaatata aaaaattagt cgggcgtggt ggtacgcgtt 9180tgtaatttta gttattcgga ggttgaggaa ggagaatcgt ttgaattcgg gaggtagaag 9240ttgttgtaag tcgagatggc gttattgtat tttagtttgg gtgatagagt aagattttat 9300ttttttcgtt tttattttta ttttgttaaa aaagttgtag atgttttttt ttttagtttt 9360atttattgtt tatggtaggg tatgaagtag tagcgtatat tattaggagt aattgtgggg 9420gtaagcgttt tttttttggt aattcgtttt atgtttttgt acgttgttgt ttgtattttt 9480tattgtttgt aagttttatt gtcgtttagg ttggagtata gtggtgtgat tacggtttat 9540tgtaattttt atttttttgg tttaaatgat ttttttattt tagtttttta agtagttggg 9600attataggta tatattatta cgtttagtta attttttttt tttttttttt ttggtagaaa 9660cggggttttt ttatgttagt taggttggtt ttaaattttt gggtttaagt aagttgtttg 9720tttcggtttt ttaaagtgtt gggattatag gtgtgagtta ttacgtttag ttattttttg 9780tgtttttaaa ttattttagt tttattattt aatgattata tatttgggta atttgttttt 9840tttttgtgtt ttagtttttt tatttgtaat atggggttat ttatggtatt gattttatag 9900ggtgtgtttt agtttatttt gtgttgttat atataatatt tgggattagg tagttaataa 9960aaaagagaaa ttgatttttt atagttttgg aagttgggaa gtcgaagatt aaggtgttgg 10020taggtttggt tgtttggtga gagttgtatt tggaggaatg ttgcgttttt atatagacgg 10080tgggaggtag aaggtggaag ggtaggtgag tttcgtgttg ggcgaagttt tttttatgag 10140ggttttaatt ttatttatga ggaaggagat tttttcgttt aattatttat tataggtttt 10200atttgttaat ttttttatat tggtagtatt tgaattttgg agggggatac gtttaaaata 10260tagtaggttg ttttgataaa ggaagaaagt gtaggtcggg cgtggttgtt tatatttata 10320attttaatat tgtaggaggt tgaggtaggt aaaattgttt tagtttgggt aatacggttt 10380taaatttgat tagtttgggt aatatggtaa atttttgttt ttataaaaaa aaaaaaaaaa 10440ttaggtgtgg tggtgtatat ttgtagtatt agttatttag gaggttgagg tgggaggata 10500gtttgagttt gagaggttaa ggttgtagtg atttgagatt atgttattgt attttagttt 10560gggtaataga tcgagatttt gttttagaaa gagaaaaaga aaaaaaagga atgtaaagta 10620tttagggtag tgtttagtat taaggattta ttaaatattg tttttgtaaa ttgaagtatg 10680ttgtttttga taattttgtt aatataaaag aggtttattt tttttttatt tgtatttttt 10740tgttattttt tataaaggaa gttgagttgt taatagttta atgtgattgg tttggtacgg 10800tggtttatat ttgtaatttt agttattggg gatgttgagg taggagaatc gtttgaattt 10860gagaggcgga ggttgtagtg agtcgagttt atgttattgt attttagttt gggtaataga 10920gtgagattgt taaaaaaaaa aaaaagttta atgtgattat tgtatatttt ttttttttat 10980attaaggtgt tgtaagttta tatataaata tatgttattt tttttttttt tttttttttg 11040tatttttttt tttttttttt tttttttttt tttttttttt ttttattttt tttattttaa 11100ataaaaatgg gtttatattt atttgttttt ttattagtta ataatatagt atggatattt 11160ttttgagtta ttatatatag ttaatttatt ttaatttttt taatttttaa aatttgttta 11220tttgagatag ggtttttttt tgttatttag gttggagtgt agtgcggcga ttacggatta 11280ttgtagtttt aattttttgg gtttaagtga tttttttatt ttttagtttt ttgagtagtt 11340gggattatag gtatatatta ttatgtttag ttaatttttg tacgttttgt agagaaggga 11400tttcgttttt gttatgttgt ttaggttggt tttgaatttt tgggtttaag taatgttttc 11460gttttggttt tttaaagtgt tggaattaga agcgtgagta atcgtatttg gttaatagtt 11520tttaaaaatt tttttttatg ataaggtgtt attatgttgt ttatgttggt ttttattttt 11580tggttttaag ggattttgtc gttttagttt tttaagtagt tggattatag gttttagtta 11640ttgtgtttag ttagtttaat ttattttttt ttatatattt tttattttta ttttaattta 11700tttatttttt tgagataggg ttttattttg ttatttaggt tggagtgtag tggtaagatt 11760ttagtttatt gtaatttttg ttttttgggt ttaagcgatt tttttgtttt aggttttcga 11820atagttggga ttataggtgt tcgttattat atttagttaa tttttgtatt tttgtagaga 11880tagggtttta ttatgttggt taggatggtt ttgatttttt gatttcgtga tttgttcgtt 11940ttagtttttt aaagtgttgg gattataggt tcgagttatc gtgtttggtt aatttatttt 12000tgttaatagt aaaatatttt gtagtgtgga tgtatttata attttttaaa atgtttttta 12060tagataatta ggttatattt aatttttgtt agtgaaaagt atggtgtaat atatattttt 12120gtttttatag tttgaagttt ttagtttgta gaatagattt ttttaaattg gagagcgaga 12180taaaagattt atgtgttttt aaagttttaa gagattttgt tttattattt tttttaaagg 12240ttgaggtagt ttttattttt attagtaagg tgttaatttt tttgttggta taattttaat 12300aattttgggt gttatttgtt ttatattttg tgggtaaatg taaatttacg gtaaatgtaa 12360atatagtatt tatgtaaacg aatgggtaaa tgttttattt taattttgtt ttttttgata 12420ggttacgtag agtatttttt tttttttttt tgagacggag ttttttattg tcgtttaggt 12480tggagtgtaa tggtgtaatt ttggtttatt gtaatttttt tttttcgagt ttaagtgatt 12540tttttgtttt agttttttaa gtagttggga ttataggtgt ttgttattat atttagttaa 12600tttttgtatt tttagtagag atagggtttt attatgttgg ttaggttggt tttaaatttt 12660tgattttagg tgatttgttc gttttggttt tttaaagtgt tgggattata gttatgagtt 12720atagagttta gttgttaata ttatttatta aattagttat tgatttaaat gtttttttta 12780atttttagtg tttttaaggg gaaaatatat ttttggttat aggagatgga atgtataatt 12840taatgttaaa taaagtcgtt ttttttttta tagattgtaa tttttttgta gttgaaggtt 12900tgttggttgg taatgggttt tttttgtgtg ttttgtgtgt gtttttgtag g 12951 12 12951DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 12tttatagaga tatatataaa gtatataggg aaaatttatt attaattagt aaatttttag 60ttatagggga gttgtagttt gtaaaggagg gggcggtttt gtttgatatt aggttatgta 120ttttattttt tgtagttaga aatgtatttt ttttttaaaa gtattgaaga ttaaaggaag 180tatttaaatt agtggttgat ttaataaata atgttgataa ttgggttttg tggtttataa 240ttgtaatttt agtattttgg gaggttaagg cgggtagatt atttgaggtt aggagtttga 300gattagtttg gttaatatgg tgaaattttg tttttattaa aaatataaaa attagttggg 360tgtggtggta ggtatttgta attttagtta tttgggaggt tgaggtagga gaattatttg 420aattcgggag ggggaggttg tagtgagtta agattgtatt attgtatttt agtttgggcg 480ataatgggag atttcgtttt aaaaaaaaaa aaaaagatgt tttgcgtgat ttgttaggaa 540aagtaaaatt aaaatgagat atttatttat tcgtttatat gggtattgtg tttatattta 600tcgtgagttt atatttattt ataaaatgta aaataaataa tatttagggt tattaagatt 660gtattaatag aaaaattggt attttattgg tggggataag aattgtttta atttttaggg 720aaagtaatga ggtagaattt tttgaaattt taaagatata taaatttttt atttcgtttt 780ttaatttggg ggaatttgtt ttatagatta aaagttttag gttataagag taaagatgtg 840tattatatta tgttttttat tggtaaaaat tagatataat ttgattgttt atggggaata 900ttttaagaaa ttatgggtat atttatatta taggatattt tgttgttaat aagaatgagt 960tggttaggta cggtggttcg agtttgtaat tttagtattt tgggaggttg aggcgggtag 1020gttacgaggt taagagatta agattatttt ggttaatatg gtgaaatttt gtttttataa 1080aaatataaaa attagttggg tgtggtagcg ggtatttgta attttagtta ttcgggagtt 1140tgaggtagga gaatcgtttg aatttaggaa gtagaggttg tagtgagttg agattttgtt 1200attgtatttt agtttgggtg atagagtaag attttgtttt agaaaaataa ataaattaag 1260ataaaagtaa aaaatatata aaaaagaatg agttaaattg gttgggtata gtggttggag 1320tttgtaattt agttatttgg aaggttgagg cggtaagatt ttttgaggtt aggagatgga 1380gattagtatg ggtagtatag tgatattttg ttataaaaaa aaatttttag agattgttga 1440ttaggtacgg ttgtttacgt ttttaatttt agtattttgg gaggttaagg cgggaatatt 1500gtttgagttt aggagtttaa gattagtttg ggtaatatga taaaagcgaa attttttttt 1560tataaaacgt ataaaaatta gttgggtatg gtggtgtatg tttgtagttt taattattta 1620ggaggttgag agatggaagg attatttgaa tttaggaggt tgaggttgta gtgattcgtg 1680atcgtcgtat tgtattttag tttgggtgat agagggagat tttgttttaa ataaataaat 1740tttaaaaatt aaaaaaatta aaatgaatta attatatgta gtgatttaaa aagatattta 1800tgttatatta ttaattgata aaaaagtaag tgaatatgaa tttattttta tttaaaatga 1860aagaagtgag aggaagggag agagggaagg gaaggaagaa aaaagaaaat ataaaaaaaa 1920aagaaaaaaa gaaatgatat atatttgtat gtagatttgt agtattttgg tatgaggggg 1980aaaaatgtgt agtgattata ttaaattttt tttttttttt gatagtttta ttttgttgtt 2040taggttggag tgtagtggta tgaattcggt ttattgtaat tttcgttttt taggtttaag 2100cgattttttt gttttagtat ttttagtagt taggattata ggtgtgagtt atcgtgttag 2160gttaattata ttaaattatt aatagtttag ttttttttat aagaaatggt aaagaggtat 2220aggtagaagg gaaatgggtt ttttttatat taataaggtt gttagaggta gtatgtttta 2280atttgtaaga atagtattta gtggattttt agtgttaggt attgttttaa gtgttttgta 2340tttttttttt tttttttttt ttttttgaga tagggtttcg atttgttgtt taggttggaa 2400tgtagtggta tgattttagg ttattgtagt tttgattttt taggtttaag ttattttttt 2460attttagttt tttgagtagt tgatattata ggtgtgtatt attatattta attttttttt 2520tttttttgta gagataggga tttgttatgt tgtttaggtt ggttaaattt ggagtcgtgt 2580tgtttaggtt ggggtaattt tgtttgtttt agttttttat agtgttggga ttataggtgt 2640gagtaattac gttcggtttg tatttttttt ttttgttagg ataatttgtt atgttttaaa 2700cgtgtttttt tttaaaattt aggtgttgtt aatgtgagag gattaataga tggggtttgt 2760gataggtgat taggcgaggg ggtttttttt tttatgagtg ggattaaggt ttttataaaa 2820gaggtttcgt ttagtacggg gtttatttgt ttttttattt tttatttttt atcgtttatg 2880taaggacgta gtattttttt aaatgtagtt tttattagat agttaaattt gttagtattt 2940tgattttcga ttttttagtt tttagaattg tgagaaatta attttttttt tttattaatt 3000atttagtttt aagtattatg tatggtagta taaaatagat tgagatatat tttatgaggt 3060taatattatg agtagtttta tgttatagat gagaaaattg aggtatagga gagaagtaag 3120ttatttaagt gtgtagttat taagtggtga agttggaata atttaaaaat atagagagtg 3180gttgggcgtg gtggtttata tttgtaattt tagtattttg ggaagtcgag gtaggtagtt 3240tgtttgagtt taggagtttg agattagttt ggttaatatg gagaaatttc gtttttatta 3300aaaaaaaaaa aaaaaaaaaa ttagttgagc gtagtggtgt gtgtttgtag ttttagttat 3360ttaggaagtt gaggtgggaa gattatttga gttagggagg tggaggttgt agtgagtcgt 3420gattatatta ttgtatttta gtttgggcga tagtgagatt tataaatagt gagaaatata 3480aataatagcg tataagggta tagagcgaat tgttagagaa aggacgttta tttttatagt 3540tgtttttgat aatgtgcgtt gttattttat attttattat gaatagtggg tggagttggg 3600agagaaggta tttgtaattt ttttggtagg gtgggggtgg gggcggggga gatggagttt 3660tgttttgtta tttaggttgg agtgtagtgg cgttatttcg gtttatagta atttttgttt 3720ttcgggttta agcgattttt tttttttagt tttcgaatag ttgggattat aggcgcgtgt 3780tattacgttc ggttaatttt ttgtattttt tgttttagta gagatattat gttagttagg 3840atggtttcga tgttttaatt ttatgattta tttgttttgg ttttttaaag tgttgggatt 3900ataggcgtga gttatcgcgt ttagtcggta tttgtaattt ttttgtatta tttgaataat 3960tagaaataat taaaataatt agaaaggtat atttaaattt taagtttttt ttttgttttt 4020attattgatt atatttagta aggtaagtgt tttttgggtt aaatttagcg aagtgtaatt 4080tttagggttt aatatgttaa attaggggat ttttaaattt ggttttaggg ttttggattt 4140ttaaaattaa gatttagtgg aataggtgtt tggtgatgat tttaatgcgt tggaagtgat 4200tgatttgttt gggatagttt ggaaaaagga aaaggaagtt ttgaggttgt tttaataaat 4260ttttattttt ttaatttatg gatttaatat gattgggagg gaagtgagta tatttagttt 4320taataggtat tttttttgta atttattttg ttattagttt tattaatgtt tattgatcgt 4380cgttttgata gtttttgttt gtttgttttt ttgagataga gtttcgtttt gtcgtttagg 4440ttggagtgta gtggcgcgat ttcggtttat tgtaagtttc gttttttagg tttacgttat 4500ttttttgttt tagtttttcg agtagttggg attataggcg ttcgtcgtta cgttcggtta 4560attgtatttt tagtagagac ggggttttat cgtgttagtt aggatggttt cgattttttg 4620atttcgtgat tcgtttgttt cggtttttta aattgttggg attataggcg tgagttatag 4680cgtttagtta atagttttta ttttattgat tttttattaa tgttaataag tattttttaa 4740gtagtaagat agttaaggta ttttttagaa aatgagtaaa ttaggatatt tattttttgt 4800ttttttaagg agtttagatt ttaatagtta taagtaggtt tgtgatttta taatttttta 4860tgtaaggtaa tatataagta ggaataatat atttgtaata aatataatta ttaaagtgta 4920gtatttggaa taggtagatt tttaaaataa tttaaaagaa aaatgattaa aagaaggttg 4980tgggtgggtc gcggtggttt atatttgtaa ttttagtatt ttgggaggtt gaggcgggta 5040gattatttta tgttaggagt tagagattag tttggttaat atggtgaaat ttcgttttta 5100ttaaaaatat aaaaaaaaat taattaggtg tagtggtagg tgtttgtaat tttagttaat 5160cgggaggttg aggtaggaga attgtttgaa tttaggaggc ggaggttgta atgagtcgag 5220atcgtattat tgtattttag tttgtgtaat agagtaagtt tttgttttaa ataaataaat 5280aaaaagatgt ttgtgaatag gtaatttaaa agttttttgg gttttggagg gtttattttt 5340tttttttgtt atttaattag ttgagtaata tgatttggga ggagttagat tattagagtt 5400tattttgaga gaggttataa gatgtatata cggataattt ttttagggta taatggtatt 5460agtgtgttag gagaggtaag ggataaagtt taatagaagg ttgggtgtgg tggtttatgt 5520ttgtaatcgt agtattttgg gagatcgagg cgggtggatt atttgaggtt aggagttaga 5580gattagtttg gttaatatgg tgaaatttcg tttttattaa aaatatataa ttagttgggc 5640gtggtggtgg gcgtttgtaa ttttagttat ttgggaggtt gtagtataag aatcgtttga 5700atttgggaag tggagattgt aatgagttaa gattacgtta ttgtattata gtttgggtaa 5760tagagtgagt gagattttat tttaaaaagt ttaatagagg aaaattttag gattttaggg 5820ttggtttatt cggaaaggtt tttagaggag tttgttattt gagttgaatt ttggttttga 5880atttttggtt ttaagtagtt ttttcgtttt agttttttaa aagtgttggg attataggaa 5940tgagttatta tttttagtta aaattttttt tttttttaat tagttgggtt ttaagttttt 6000ttgttttgat taaaaaaaat tagttgggtg tggtggtata tatttgtagt tttagttatt 6060cgggggtaaa gatgggataa ttatttgagt ttaggaggtt aaggttgaag tgagttttga 6120ttatgttatt gtattttagt ttgggtaata aagtaagatt ttgttttaaa aagaaaaaaa 6180gaagtatgat aaagataagt ttttgtatta gttttatgta tttttttttt gttttttttt 6240tttatttgag tgttttaggg aatatgagtg taaattagat gtatttatta gttgtaaata 6300aaaattttgg atgttttagt taattttaag atttggttag ttgggtatag ttaaaattaa 6360ttatataaga tttaagtttt ttttttttat tttattatta tcgttttttt ttgtgtttaa 6420gttatacgta aatatagaat attttgtaag attgaaaagt taggaaatag tttttgtttt 6480agtattggag gagagggtgt tagtgtttcg acgttgaaga atgaaatata agggaaatag 6540taattatcgt gtatgcggta agttttttag ttgttagaat ttattttttg ttgtttttgt 6600tagtaattta tgttgggtta ttaattttta gtttagtttt ttttttagag attttgataa 6660ttttagtttg ttaattgtaa gggtagtttg tttttttatt tattttgatt aagatgggtt 6720tttttgtgta taggcgtatt tttagaggta ggattaggtt tatagggaag gaaattataa 6780aacgtaggat tttgttttag atgaggtaat agttttttaa attttagtat tgtttaattt 6840tagagtgaga ttatttggga aatagttttt aatttttgta gttgttttag ttggttattt 6900atgttttggg tggagttggg gtgatttttg agttttttta gggtcgatgg tcgagtggga 6960aggttttatt attgaagtgg atttaatatt agaaacggat ttagtacgat ttgattaggt 7020ttgtttaatt taagggtttt aatggaaaat gttttttaag gttaggtacg gtggtttacg 7080ttagtaattt tagtatttgg ggaggttgag gtgggtggat tatttgaggt taggagttta 7140agatcgcgtt ggttaatttg gcgaaattcg tttttattaa aaatataaaa attagtcgcg 7200tatgatggcg tatttttgta attttagtta ttcgggaggt tgagatggga gaatcgtttg 7260aattcgggag gcggaagttt cgttgagttg agatagcgtt attgtattat agtttgggcg 7320ataagagtaa aatttcgttt taaataaaat aaaataaaat aaaataaaat ttgtgtttgg 7380tagtttggag tcggttttgg ttttcgttaa attaaaggta ttagtttttt ttatttttgt 7440ttattaatcg ttagatattt ttattttttt tagaagttcg gaatttatat ttttaagtga 7500aattatttat tttaatgtta gtaatttatt ttaaagtgtt ttagatatta tagattaaaa 7560gaggtatggg ttgtgatcgt aagtttgatt tggtttttga cggttagttt ttgattatag 7620ttttggaggg aatttttgtt tttaaggtta agtttttttt aaatgtttat tagagttcgt 7680ggggtggagt gaggaaggat tcgcgatatc ggatataaat agaagttttt tttttttcgg 7740agttcgatta aggtttattt taggttttta attttttttt tttgtgggtt ttgagttaag 7800gaataaaatt tagggttaag tttttataat tttttttata ggtattagtg ttcgagagac 7860gatcgttaag tatttcgttt tttgtagtat ttatcgatta tggttttggt gtagttcggg 7920gcgttgattg gttgggttcg tggttgtcgg ggcgattttg gtcggaatta ggttttcggt 7980gagttgggcg gtttcggttg taattttgtg ggagtcgcgt gtgtagtgta cggtgtattt 8040ttttttatat attttgttcg gttcgtttga ggtggatagt ttataagggc gggatttaac 8100gtttgaattt tggggtgttg ggcggaggat gttgaggttg tagttttagg aagggaggga 8160gtttggggga tgaaggaggg gtttttttat ttttattcgt cggagtaatt ggtggaagtt 8220aagaaaagtt tttcggggtt gggggagggg attgtagggg tgtgtgtgat agaggtttta 8280aaaatttggt tgggggtgtt aaggtaagtt tatttgcgta ttgtgttttg aggtgtaaga 8340ggatgtaggg tggaagtcgt tttaagagag tttagggatt aagtgggtat gtttttttag 8400ttttggtacg aaatggagta gaaaaagagt cggatgcgga ttattgtggt gttttaggtt 8460tagattttgt tgagttattg tgattgcgga tttggaaggt tgagagtttt ggggagatat 8520gtttcgtgga gacgaatttg tttttttttt tgtaagattt agattttgta tttgggggtt 8580tatataatat atttttttgg gtgtatgtta ttgtattatt tttgtttttt aaggtaggta 8640atgggggaat taattggttt tgttttttat gagttaaggt aaggttggtg tggagatagt 8700agttataggg aagtatatta aagaatagtt aaaacgggat taggcgcggt ggtttacgtt 8760tgtaatttta gtaatatggg aggtcgaggt gggtggatta tttgaggtta ggagttcgag 8820attagtttgg ttaatttggt gaagtttcgt ttgtattgaa aaattagttg ggcgtgatgg 8880cgggcgtttg taagttttag ttattcggga ggttgaggta ggagaatcgt ttgaattcgg 8940aaggcggagg ttgtagtggg tcgagatcgt gttattgtat tttcgtttgg gtgacgaagt 9000gagatttcgt tttaaaaaaa attttataaa gtaaaagtta ttgtaaagaa ggagatatat 9060ttttagtagg tgaaggaaaa agaattagag ttttaaagtg gtaattaatt attagaagaa 9120ttatagatgg gggaggtgag gatgatatag ggttttttcg ttgttttttt agtgtaaaag 9180ttaaggaggt attagaaaat tggtttttaa ttttcgattt taggtgattt tatcgtttcg 9240gtttttcgaa gtgttgggat tataggtatg agttatcgcg ttcggtttta tcgtgatatt 9300tttgtattta ttttgatgta ataagagagg attatattat ttatacgtat ttataaatta 9360ttttgggagg ttgaggtagg aggattattt gagtttaaga gtttgagaaa agtttgagta 9420ataaagtgag attttatttg ataaaatagt ataaaaggac gttttaaaaa agggttaggt 9480aggtagtttt gtttaataga atttttttta tttgtgttgt ttaagtaagg tagttataag 9540ttttaagtag ttattgagta ttggaaatgt ggttagtagt taggcgtggt ggtaggcgtt 9600tgtgttttag ttatttagga tttgaggtaa aaagatcgtt tgagtttagg aatttaaggt 9660cgtagtggtg gatttaataa aagaaaaaaa atggaaatta aaaaaaaaaa agtggttagt 9720ggattgagga agtgaagttt taattgtaat taaattaatt ttttaaaaat ttattttttg 9780aggcggggtt ttattgtgtc gtttaggttg gagtgtagtg gtaggatttt ggtttattgt 9840aatttttatt ttttgggttt aagtaatttt tgtgttttag ttttttgagt agttaggatt 9900acgggtatgt attattatag ttagttattt tttgtattat tcgtagagat gagttttatt 9960atgttagtta ggttggtttt aaatttttga ttttaggtga tttgtttatt tcggtttttt 10020aaagtgttag gattataggt atgtgttatt gcgtttggtt ttaattaaat ttagatagtt 10080atatgttatt agtgtttgga aagatttgag ttggtttaga tcgaggtcgt agtgtgttgg 10140ttattttatt ttttattttt ttagtgagat tgttttttta attattagtt tttttgattt 10200atttagaggt ggggtttaaa gttataaagt ttaagtgtcg tgttcggtcg ttggttttta 10260gtatggttag tttttatttt tagttatttt gttaatatga attatatagg ggtttatttt 10320aagttatttt attagtataa attattagga gtggtttgag aagtttataa tgaataagat 10380ggatattttt attatttggg atttaggggt ttaggggtat gatgatagtt tattgtagtt 10440tcgatttttt ttttttttat tgagtttatt attgcggttt tgaatttttg ggtttaagcg 10500atttttttgt tttagatttt gagtagttgg gatataggcg tttgttatta cgtttggttg 10560ttggttatat ttttagtgtt taatagttat ttgaagtttg tggttatttt atttgggtag 10620tatagatagg gaaagtttta ttggataggg ttgtttattt agtttttttt taaaacgttt 10680ttttatatta ttttgttaga tggggtttta ttttgttgtt taggtttttt ttaaattttt 10740gggtttaagt aatttttttg ttttagtttt ttgagtagtt gagatgatag gtgtatgtta 10800tcgtgtttgg ttaatttttt tttatttttt tggtagagat agggttttat tatgttgttt 10860aagttggttt taaatttttg ggtttatgtg attttttcgt tttgattttt taaagtgttg 10920gagttatagg tatgtgttat tatttttggt taaatttgtt attatatagt ggtaaagata 10980gatatttgag gtggtagtga attaagatta tgttattgta ttttagtttg ggtaatagag 11040ggagattttg ttttaaaaga aaaaaagaaa tttattggtc gggtatagtg gtttaggttt 11100gtaattttag tattttggga gattgaagcg ggtggattat ttgagtttag gaattggaga 11160ttagtttggt taatgtggtg aaatttcgtt tttattaaaa atataaaaat atgagttggg 11220tgtggtggtg ggcgttttta gttttagtta ttcgggaggt tgaggtacga gaatcgtttg 11280aatttaggag gtagaggttg tagtgagttg agattgtgtt attgtatttt agtttgggta 11340ataagagcga gattttattt taagaaaaaa agaaaaagaa aaagttgttg tggagtatgg 11400gcgagtattg ttgtttggat aaagatcgag ggttttcggg agggtagtat tgatgtatag 11460gtttttagta ggtcggcgtg tgtgtttttt tttgtaggtt tgtagttagg cgtgttagga 11520gagggggagt ttgagggatt gatgtaggtt gggaaagtat gatgagagga gatagagtgg 11580gggttgtgaa gaagagagcg atttgatggt ggcggtagtt atataggtgt atgtatttat 11640taaaattcgt tgaaaagtat attttaaata taagtatttt attgtatgta tgttattttt 11700taataaagtt tatttttaaa aagtagagtg gttggagtga tgacgaatat tatgaaaggg 11760tttattggta gagaaaaagt agaggggttt agagatttaa gtttttaagg aggttgaagt 11820aagagtgggg gattaaataa gggtaaaaat tgagagaata aaaaaagtgg gttgtttggg 11880gttaggtgcg gtggtttata tttgtaattt tagtattttg ggaggttaag gtagggggat 11940cgtttgagtt taggagttta agattagttt gggtaatata gtgagatttt ttttaatttt 12000ttttattttt gttattttta aaaaaattaa aaattagtta ggtgtggtgg tgtgtatttg 12060tggatttagt tatttaggag gttgagatgg gtggattatt tgagtttggg aagtcgacgt 12120tatagtgagt tgtgattgta ttattgtatt ttaatttagg tagtatagtg atattttatt 12180taaaaataaa aagaaaaaat aaaaatttaa gtgggttgat tgggaaatat aggagataga 12240agttaaaatt atggggaaat attagttaaa ttatagtgtg ggatatttta taggataatt 12300aatttggttt attttataat ttagtgttat aagaaaaatg aaggagtgta tattgattag 12360gattttttag agaaatagaa ttaattgaat ttttataaat atataaaaag taatatattg 12420ttgggtgtag ggtttatatt ttgtgatggt taataatgag tgttaatttg attggattga 12480aggatgtaaa gtattgattt tgggtgtgtt tgtgagggcg ttattaaagg aggtgaatat 12540ttgagttagt gggattggga agggcggatt tatttttaat ttgggtgggt attaattaat 12600tagttgttag tgcggttaga atataaagta ggtagaaaaa cgtgaaaaga ttagattagg 12660tttggtgtcg tggtttacgt ttgtaatttt agtattttgg gaggtcgaga cgggtggatt 12720atttgaagtt aggagtttaa gattagtttg gttaatatgg taaaatttat ttttgttaaa 12780aatataaaaa aatttagttg ggtgttgtgg tgtatgttta taatgttagt tatttaggag 12840gttgaggtag gagaatagtt tgaatttagg aagtagaggt tgcggtgagt cgagattata 12900tcgttgtatt ttaatttggg tgatagagat ttattttatt aaaaaaaaaa a 12951 13 8451DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 13gacggagttt tattatgttg gttaggttgg ttttgaattt ttgattttag gtgatttgtt 60tattttggtt tttaaagtgt tgggattata agtatgagtt attacgtttg tttttaagta 120tattttttta gtttattttt tttagtatgt aatttataga agggtaattt gaattgtaaa 180tacgattttt aagttaaaat ttttgggtta gttcgtgatg aagtagtaat ttataaaaga 240gatagtatag taataaatga gataattata ttcggaaatg tggaattatt aatttttatg 300cgaaaatagt ttatgagatt tttgtgtttt tttatttatg ttatgcgttt ttttattttt 360attttatttt attttatatg tttttttttt tgtttggatt atttttattt tattattatt 420ttttttttgg taaattttta tttatattta aaaattttgt ttaatgattt tttttttgtg 480aaaattttgt ggtaaaattt aattattttt gtttgtgtat attttttttt tatttgtgtg 540tatatagtat gtgtttataa ttggaagggt gtttatttgt tattcgtttg tttgttttgt 600taaagtgtga gtttttatag ttatagggtt gtgtgttagt tttggtgttt gtatagtatt 660tagttagtag ttatatttag tgttgttgaa ttaatttttg gtttaaaaat atgtttatat 720ttgttttttt aaggcgttaa tttaaatttt ttatttattt taaaaaataa ataatttttt 780ggtattttaa aaattatatt taaataatag aaaaagagtt tatttgaatt ttaagtatta 840attttaaaat gaattgtatg ttttaaaatt tgatttagtg atattattta agagaatttt 900taaaaagtaa atttttattt ttattttagt gtaataaata ttaagtttta ttaaattatt 960aaattgattt attttttttt ttttttttga gatggagttt tgttttgttg tttaggttgg 1020agtttagtgg ggtaatttcg gtttattgta attttcgttt atttaggttt aagcgatttt 1080tttgttttag tttttcgagt agttgggatt ataagtgtat attattatat ttagttaatt 1140tttgtgtttt tagtagagac ggggttttat tatgttggtt aggttggtta cgaatttttg 1200atttaaagtg atttgttcgt tttggttttt taaagtgttg ggattatagg tgtgagttat 1260tatatttagt ttgtttttta ttttttggtt tttttttttt tttttttttt tttttgagat 1320aggttttttt ttttaggttg gagtgtagtg attatagttt attgtagttt taattattgg 1380ggtttaagta atttttttat tttagttttt cgagtagttg ggattttagg tatgtattat 1440tatgtttggt taattttttt ttattatttg tggagatggg gttttgttat gttgtttagg 1500ttggttttaa atttttgggt ttaagtaatt tatttgcgtt ggttttttaa agtgttggga 1560ttataggtga tttatttttt aattgtgtta aagaataaag tatttatttt atttgttttt 1620ttgtatttaa aatggttttt tatattttag atttagaaag ataaatataa gtaaattaat 1680aagtatttta tttgtattat ttgttgtttt ttaatagttt atatttagtt tatttttgaa 1740gggtaaagat tattgattgt ttatttaatt tttttatttt gaatttagtg agattttttt 1800ttatttttta taaatgtatg tttaaaattt gattttagtg tagaattgga attaaaatgt 1860atgtaatttt attttttata gtaggagtta aatgtttatt aagttttttt ttgagtttag 1920tattttgtag ttaaatgatt attatttttt agttacgttt ttaaaaaaaa ttatgttggt 1980ttgtaataaa aattgtattt tttttattag gtaagtgaat tattttgttg ggaagagtat 2040tttggtttcg agaaaaaaat gattttattt tgaaaggttt tttttttaat ttttttttgt 2100ataaattttt agtttagtaa tttgttagta ttttggaaaa gtgtattata aaataaaaat 2160tcgaattaga taaaatatat ttttggaatt tttgaggtag attaatgaag ttttgatttt 2220aggtgttagt aaaataaagt aggtattttt attttgtatt gttttatttt ttagtttttt 2280atggtgtttt ttaaattttg atgttttgaa gaagttttaa tgtttgttat attagtagga 2340gttgattata gggaagagat aaatatagtt ttttttggaa aggtgaaggt ttagttatta 2400gaattttgtt ttttgatgtt gagaatgtat ttttttcgaa tagatggaaa agaggggtgg 2460agattatttt agggatatat tttgtaaaat gttgatattc gaagatgtat atagttttgt 2520gttttggtta tttttttaaa ttatgttttt ggtgaaggta tatggagagg agagtagatg 2580ttgttagatt acggtgtttg acgttatgta tttttttacg tttagtttgt ttatgtgtat 2640acggttgtag cgggattttg gggtgtgggt taaataataa gaataggggt ttttttgggg 2700tttgttataa ggtagagatg ttttacggta attagggatt taggggaaga ggaaggaata 2760tatatgttga taataagtag tttaatatta ttatttttat tttatagatg tagttattga 2820gtttagagag gttttataat ttgtttagag ttttttaatt agtaaatagt ggagtcgaga 2880tttgaacgat ttaaagagga aagtaaataa gtagtttttt tattattttt tttttttttt 2940aagatgaggg ttttgttatg ttgtttaggt tgatattgaa tttttggtta taagtgattt 3000attattttgg ttttacgaag tattgggatt atagttatga gttattatat tgggttaaag 3060ttttcgtatt gtaattttta agatgttttt atttttaaag ttaaaggttg ttagagttgt 3120tgttttgtag ggagttatgg gatggggagt tttcgggaaa tttaggttgg ttttttaaat 3180ggtattattt aagttggtta ttaagttttt ttagatttag ttattcggtt tttttttttt 3240ttggttgtag agtaggggtt tggattcgag gttgttgagt ttttttttag tttttatgtt 3300tagtggtagt gatttattaa ttggtttatt cggtggatgt aggggtgatg tagttttgtt 3360ttgttttttt gagtgttggg tggttatgag agagggaggt tatgagaggg aggggagggt 3420ttttatttgt ttagtgttat ttttttttta gtttatttta ggttttttgt cgttttgggt 3480ttttgcgtga gtagtttttt ttattttggg cgatgttcgt ttttattagt ttaattttaa 3540gaagtttatt ttggggagga tagagggagt ttttacggtt ttatattttt atgttttgtc 3600ggagatttgg ttaggtagag tggtgttttt ttgattgagt ttcgagtttt tgtttttttt 3660ttattttata taaagtcgta gttttggcga gggagtttag aggtttgagg atagtttgtt 3720gggtgtttgg tattttttag attttttttg tttgggcggt gggtatttgt aatttttttt 3780gtttcgaatt gtagtagaat gtgtgggtag ggttaggtag atagagagtg ggtgtttgga 3840tttattggtt agattttaag atcgtttatt ttcgtcgttt tcgtagtttt ttttaggatt 3900ggttgattta ttagataggg gagggtgttg ttttttatta ttatattttt tgagaaaagt 3960tatgtaggtt tgggagacgt ttgtgtttta ggagtttttt ttggtttgaa gatttaaggt 4020tgtaaatagg tgttgagagg gaataagaag gggagttggg gtgtaatata tttagtgata 4080gattaggagt gagtgttgtg gttatagatt ttaattttta taattgtagt gtgatttagg 4140ttaagttttt tgtttatttc gatttttgtt ttaaataagt gaaaaggaaa gttaagtttg 4200atgagttgtg gttttttagt gggtggattt gtatgtatta tggattatat ttattagggt 4260ttaggaattg ttaagcgttt agtaggttgt tattaggttt tcgagttttt tcgttaggcg 4320gttttatttg gagtaagagg aaagtaaagg tttgaggttt agttaagagg gcgttatttt 4380gtttggttag tttttcgata aagtagacgg gggggtgtgg agtcgtggtg atttttttcg 4440ttttttttag ggtgggtttt ttgggtttgg gttggtggaa gtgaatattg tttgtagtaa 4500gaagaaggat tgtttatgtg ggagcgtaag gcggtagcgg ggttggaaat ttatttttat 4560atagttaata tttgttgtta tattaggtta attaagaata tttttttttg gtgtattaat 4620tatttgttat taaataaagg gttgttatta ggtggtaaag taatatattg tagtagagtt 4680tatttgtaat ttgagattag tggttgtaag gtattatttt tgagttaagt aagtattaat 4740atttttgtta ttttaattag aatgtaagag atcgtgtttt taaaattttt tttgaatttg 4800ttattttgtt tttttttttt tgggtgatat atttggtagt gttggtgggg gttattataa 4860tgttttttgt tttagatttt ttttttttag atgggattcg agtattgatt attttagttt 4920tgtatttttt aggttagcgt ggtttagttt gttgtgtaga gtttagggga gataattacg 4980ttgtgtatat atgagattgg ttgatttggt aggattgtgt aattgttaga aggtcgtggg 5040gagtgggggt tagtgtttgt agtttgtttt gtttttttta taggttttta gagtatcgtt 5100aggtgtagag ttttatagtt ttttttttta aggagtaatt agagggtgag aacgtggagt 5160ttggtggata ggtgaaagta ttgggatttt tttgtttaga aaggggaaag ttgtatattt 5220atattttaga gggaagcgat agtagtgttt ttttttgtgt tgaggtatag gtaaggaggg 5280tggtttgtaa agtttattgg ggagggtgat ttttttttat tgttttaata ttatgttcgt 5340agtttttttg ataatattat gtaaaatgtg ttttattagt ttttagtgta taaaatattg 5400gtggagtttt tcgttgtgtt gggttagtta ttagtgttgg gtattgtggg ttaaggtagt 5460gtttaggacg ggtatagttt tgttttttta agttatggtt tattgtggta ggatttgttt 5520gtttagtgaa gtgtgtttag ttgtttttgt tgttggggga agttttgttt tttgttttcg 5580gttgtttttt atacgttttt atgtgttttt tagtttttaa tttttagttt tgtttttaat 5640atcgtagggg tttttagttg attttttttt atttttttaa agggtaggat tttttggtag 5700agatataacg tttttttgga aatgaaagaa gttgatgtat gttttttttt ttttgaatta 5760tttaaataag aggaatttat ttttaggtat tttttgtttt gtttttattg tgggagtgtg 5820gttttagttg tttatttgat tagttgatat agggtttttg gggtttaggt attgttattg 5880tttgggattg aaagatgaaa gttatagggt taggtatagt agttcgtgtt tttaatttta 5940ttattttgga aagtcgaggt gggcggatcg ttggaggtta ggagtttgag attagtttgg 6000ttaatatggt gaaacgttgt ttttattaaa aatataaaaa ttagtaggag gtggtggtat 6060gtatttgtaa ttatagttat ttaggagttt gaggtacgag aattttttga atttagggat 6120agaagttgta gtgagtcgag atcgtattat tgtatttttt gagattttgt tttaaaaaaa 6180aaaaaaaaaa aaaaagggaa agtaatggtt tggtttggtt ggagatggaa tatgtattaa 6240cgtgttttac gtgtttttag tagggatagc gaaggtttgt tttttggtat atggtagatt 6300gagtaaatgt tgattagtga gattttgagg tattttagag ttttataatt tagagaggga 6360gatagattgg aagtttaagg gtggatattt gggtatgatt tttaggacga aggttgtagt 6420cggttttaag aagtatgttg gtgattatga gagaagaggt tgtgggtttt tttttttgaa 6480agttgttttt ataattatat gtggggtgat aagggttttg gtttagggga gggggcgagg 6540tatatagggg gttgaatttg atggtatgag gatttggtga tgggttgtgg ggaaagaatt 6600ggagatgatt ttagggtttg agggtgggaa gttgggagtt tattgggatt attgatagaa 6660acgcggaggt ggggggtgtt aagttgattt ttttgattag attttttata gaattgtagg 6720aataaggcga gagttatcgt tttgggtgga tttttgtttg gagttttatc gttggattat 6780tgtggataag tattttatag aacgattttt agtagtttaa ttttaggttt agaggggtag 6840tttttgatag gagtaaattt tagggttttt gtaatttttt agtagagttt taaatatttg 6900atatgtagtt aatggaggat atgtaagtgg tggggttttt agtagggatt attttttgtt 6960ttgggttttt aagatagagc gaggggcgtt gttggggcgt ggtttgtagg ggttttgtta 7020gaattcgatg tttttttttt cgtttgggtt ttaattgtag tgtatttaga gatttttttt 7080tgatttaggt ataaggacgg ttcgtatatt tatgtaggtt attttgaata agaatagttt 7140atgggttatt tttttaggaa tgaggaagat gaagagttag ataataatgt tgggttggta 7200tttgtttgat agtgttttgt taagattatg gttttttttt tttttgatta aaaaagatat 7260aggagttaga taaatgggga ttaaaagata attgagttga tgtgaaatgt aataggtaat 7320attatggata tagaaagtag attagaggtt gtttaggatt taacgtggag ggtagtaggg 7380gagcgatagt tgaagggtat ggagtttttt cgtgtcgatg aaaatgtttt atagttgatt 7440gtggttatgg ttgtatatgt ttgtgaatat tttagaaatt attggagggt ttattttaaa 7500tgggcgaatt gtatggtata tgaattatgt tttaataaag tttttatata gttaagttgt 7560gtggttatgg ttgggttttt tagtagtgtt ttttaatttt aaattgaatt tattttttta 7620gtatttgggt ttttttatta tttcgtttgt tttgaggata agtttttttt taagaaggat 7680agagtagggg ttgtgggtta ttatttagga aaggtgtttt ttttttttgg gggagggaat 7740ttagaggtta tggatagaag tttttttaga tatgtaaaaa atatgaggtt gtcgggcgtc 7800gtggtttata tttgtaattt tagtattttg ggaggtcgag gcgggcggat tacgaggtta 7860agagattgag attattttgg ttaatatggt gaaattttat ttttattaaa aatataaaaa 7920ttagttgggt gtggtggtac gtgtttgtag ttttagttat tcgggaggtt gaggtaggag 7980aatggtggga atttgggagg taaaggttgt aatgagttga gattgtgtta ttgtatttta 8040gtttggtgat atagtgaaat tttattttaa aaaaaaaaat aatatgaggt tttagaaatg 8100tagtttttaa aattttttat ttagggttgt gtagaagtta aattaggttt ttattttttt 8160aggatgatga atagttttta aagtttagta ggattgtggg tgattttgtt ttattgtttg 8220ttgttttttt atttttttag attatatata tataatattt atattatata taatatgtat 8280atagtgtgtg tatatatata tataatatgt atatattagg ttaagtgtaa ataaaattag 8340ggatagggtt ggagcgtagt aggaaagagt ttgttgggga ttagagtttt tgggttgtta 8400gggtcgggtt gggcgggttt cgttgttaat ggtttttttt tattttgtag g 8451 14 8451DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 14tttgtaagat gaggggaagt tattaataac ggagttcgtt tagttcggtt ttgatagttt 60agagattttg atttttagta ggtttttttt tgttgcgttt taattttgtt tttgatttta 120tttatatttg atttaatata tatatattat atatatatat atatatatta tatatatatt 180atatatagta taaatattat atatatatga tttagaaaaa tggaaaaata atagataatg 240agataaaatt atttataatt ttattaagtt ttgaaaattg tttattattt tgggaaaata 300ggaatttggt ttggtttttg tatagttttg ggtagggggt tttgggagtt atatttttga 360ggttttatgt tgtttttttt tttgagatgg agttttattg tgttattagg ttggagtgta 420gtggtataat tttagtttat tgtaattttt gttttttagg tttttattat ttttttgttt 480tagtttttcg agtagttggg attataggta cgtgttatta tatttagtta atttttgtat 540ttttagtaga gatggggttt tattatgtta gttaggatgg ttttaatttt ttgatttcgt 600gattcgttcg tttcggtttt ttaaagtgtt gggattatag gtgtgagtta cggcgttcga 660tagttttatg ttttttgtat gtttgagaag gtttttgttt atgatttttg ggtttttttt 720tttaggggag aggagtattt tttttgaatg gtggtttata gtttttgttt tgtttttttt 780ggagagaggt ttatttttag ggtagacggg gtaatgggga ggtttaagtg ttgggagagt 840aagtttaatt tggggttggg ggatattgtt aggaagttta gttatggtta tatagtttag 900ttgtgtaaga gttttattga aatataattt atatattata taattcgttt atttaaagtg 960aattttttag tggtttttag gatatttata gatatgtgta gttatagtta tagttaattg 1020tagaatattt ttatcggtac ggagaaattt tatatttttt agttgtcgtt tttttattgt 1080tttttacgtt aggttttaag tagtttttaa tttatttttt gtgtttatag tgttgtttgt 1140tatattttat attaatttag ttgtttttta atttttattt gtttgatttt tgtgtttttt 1200ttgattagaa gaggaagaaa ttatagtttt ggtaaagtat tattaggtag atattagttt 1260agtattgtta tttagttttt tatttttttt atttttaggg aagtaattta tagattgttt 1320ttgtttagag taatttgtat gaatatgcgg gtcgttttta tgtttgagtt agaggagggt 1380ttttagatgt attgtagtta ggatttagac ggaggagaaa gtatcgagtt ttgataaggt 1440ttttgtaaat tacgttttag tagcgttttt cgttttgttt tggaaattta aggtaggagg 1500tggtttttgt tgggaatttt attatttgta tgttttttat tggttatatg ttagatgttt 1560gggattttgt tggggggttg tagaggtttt ggagtttgtt tttgttaaga gttgtttttt 1620taaatttaga attgggttat tgggggtcgt tttatgaaat atttgtttat agtggtttag 1680cgatagagtt ttaaatagaa atttatttag ggcgatggtt ttcgttttat ttttgtagtt 1740ttgtaggaaa tttaattagg aaaattagtt tggtattttt tattttcgcg tttttattag 1800tgattttagt gaatttttag ttttttattt ttaggtttta gagttatttt taattttttt 1860tttatagttt attattaagt ttttatgtta ttagatttag ttttttgtgt gtttcgtttt 1920tttttttgga ttagagtttt tattatttta tatgtgatta tggagatagt ttttaagaga 1980ggaaatttat aatttttttt tttatagtta ttagtatatt ttttagaatc gattgtagtt 2040ttcgttttgg gaattatgtt taggtgttta tttttgaatt tttaatttat tttttttttt 2100ggattgtgaa attttaaagt gttttaaggt tttattgatt aatatttatt tagtttatta 2160tgtgttaggg ggtaggtttt cgttattttt gttggagata cgtgggatac gttgatgtat 2220gttttatttt tagttaagtt aggttattgt tttttttttt tttttttttt ttttttttga 2280gatagagttt taaagagtgt agtggtgcga tttcggttta ttgtaatttt tgtttttggg 2340tttaagagat tttcgtgttt tagatttttg agtagttgtg attataggtg tatattatta 2400ttttttgtta atttttgtat ttttagtaaa gatagcgttt tattatgttg gttaggttgg 2460ttttaaattt ttgattttta gcgattcgtt tatttcggtt ttttaaagtg atgagattag 2520aggtacgagt tgttgtgttt ggttttgtgg tttttatttt ttaattttaa gtagtaatag 2580tgtttgggtt ttaaggattt tatgttagtt gattagatgg gtagttggga ttatattttt 2640ataataaaaa taaggtaggg aatatttgga aatgagtttt ttttatttaa gtaatttaga 2700aaagaaaaaa tatgtattag ttttttttat ttttagaaag acgttatgtt tttgttagga 2760aattttgttt tttaagaaga tggagaaaag ttagttaaaa gtttttgcgg tattgaaagt 2820aggattaggg gttagggatt gggagatata tgggagcgtg tgggaggtag tcgaaggtag 2880agagtagagt tttttttagt aataggagta gttgaatata ttttattggg taggtagatt 2940ttattataat aaattatagt ttgggaaggt agggttgtgt tcgttttggg tattgttttg 3000atttatagtg tttagtattg gtgattggtt tagtatagcg aagagtttta ttaatatttt 3060atgtattaga agttagtaag atatattttg tatgatgttg ttaaggaggt tgcgagtata 3120atattagaat aataaagagg gattattttt tttagtgaat tttataaatt atttttttta 3180tttgtatttt agtataggga gaagtattgt tgtcgttttt ttttaggata taaatgtgta 3240attttttttt ttttgggtag aaagatttta gtgtttttat ttgtttatta ggttttacgt 3300ttttattttt tgattatttt ttgggaaaga gagttgtgga gttttgtatt tggcgatgtt 3360ttaagggttt gtgagagagg tagggtaggt tgtaggtatt ggtttttatt ttttacggtt 3420ttttgataat tgtatagttt tgttaagtta gttaatttta tgtgtgtata gcgtggttat 3480tttttttgga ttttgtatag taaattgaat tacgttgatt tgagagatat agggttgaaa 3540tgattagtgt tcgagtttta tttaaaagaa gggaatttgg gataaggggt attatgatgg 3600tttttattag tattattagg tgtattattt aggaagagga gggtaaagtg atagatttaa 3660agagaatttt aaaaatacga ttttttgtat tttaattaag ataataagaa tattagtatt 3720tgtttggttt aaggatggtg ttttatagtt attgatttta gattataaat aggttttatt 3780gtagtgtgtt attttgttat ttagtaatag ttttttattt aatagtaggt ggttaatgta 3840ttaaagaaaa gtgtttttga ttagtttggt gtgatagtag gtgttgattg tgtgggggtg 3900ggtttttaat ttcgttgtcg ttttgcgttt ttatatgaat agtttttttt tttgttgtag 3960gtaatattta tttttattag tttaagttta aggagtttat tttggggagg acggaggggg 4020ttattacggt tttatatttt ttcgtttgtt ttgtcggaga gttggttagg tagagtggcg 4080tttttttgat tgagttttaa atttttgttt tttttttatt ttaaataaag tcgtttggcg 4140aaggagttcg gaggtttgat ggtagtttgt tgggcgtttg ataattttta gattttggta 4200aatgtaattt atggtatatg taaatttatt tattaaagag ttataattta ttaaatttga 4260tttttttttt tatttattta aggtaagaat cggagtaggt aaggggttta gtttaaatta 4320tattgtagtt gtgaggatta gaatttgtgg ttatagtatt tatttttggt ttgttattgg 4380gtgtgttgta ttttaatttt tttttttgtt tttttttagt atttgtttgt agttttgagt 4440ttttaggtta gaagggattt ttagggtata gacgtttttt aggtttgtat agtttttttt 4500aaaaaatgta ataataagaa ataatatttt tttttatttg gtgggttagt tagttttggg 4560aaggattgcg ggggcggcgg gggtgggcgg ttttagagtt tgattaatga gtttaggtat 4620ttatttttta tttgtttaat tttgtttata tattttgttg tagttcgaga tagggagaat 4680tgtagatgtt tatcgtttag gtagggagga tttagagagt gttaggtatt tagtaggttg 4740tttttaggtt tttgggtttt ttcgttaggg ttgcggtttt atgtggagta aggggaaagt 4800aaaggttcga ggtttagtta agagggtatt attttgtttg gttagatttt cgataaagta 4860tgggggtgtg gagtcgtgga gatttttttt gtttttttta gggtggattt tttggggttg 4920ggttggtgaa agcgaatatc gtttagagtg agaaggattg tttacgtagg aatttaaggc 4980ggtagaggat ttggggtggg ttggggaggg ggtggtatta agtagatgag aatttttttt 5040ttttttttat ggtttttttt ttttatggtt atttagtatt taagaggata gagtagggtt 5100gtattatttt tatatttatc gggtgggtta gttgataagt tattgttatt gggtatggaa 5160gttggagagg aatttagtag tttcgagttt aaatttttgt tttatagtta gggaaagagg 5220gggtcgagtg attgagtttg gggaagtttg atggttaatt tgggtgatgt tatttaagga 5280gttagtttgg gtttttcgga gattttttat tttatggttt tttgtaaaat agtaattttg 5340ataatttttg attttagaaa tgaaaatatt ttggaggtta taatacgagg gttttggttt 5400agtgtggtag tttatgattg taattttagt atttcgtggg gttaaggtgg tgaattattt 5460gtggttagga atttaatatt agtttgggta atatagtaag atttttattt taaaaaaaaa 5520aaaaagtaat aaaggggttg tttgtttgtt tttttttttg ggtcgtttaa atttcggttt 5580tattgtttat tagttgaggg gttttgggta agttatgaaa tttttttaag tttagtagtt 5640gtatttgtaa aatggggata ataatgttga attatttatt attaatatgt gtgttttttt 5700tttttttttt aaatttttaa ttatcgtgga gtatttttgt tttgtaatag attttagagg 5760agtttttgtt tttgttattt agtttatatt ttaaggtttc gttgtagtcg tgtgtatata 5820aataggttgg acgtgaggga gtgtatggcg ttaggtatcg tggtttggta gtatttgttt 5880ttttttttat gtgtttttat taaggatatg atttgggagg atgattaaag tataaggtta 5940tgtatatttt cgggtattag tattttgtaa gatatgtttt tggggtaatt tttatttttt 6000ttttttattt gttcggagaa ggtgtatttt tagtattaag gggtagaatt ttggtggtta 6060agtttttatt tttttaagga gagttatatt tatttttttt ttgtggttag tttttgttga 6120tgtagtaaat attagaattt ttttaaaata ttaaagttta ggagatatta tgaaaaattg 6180agaagtaaaa taatataaaa tgagagtgtt tgttttattt tgttagtatt tgaaattaga 6240gttttattga tttgttttaa aagttttaga gatatatttt atttgattcg agtttttgtt 6300ttgtaatgta tttttttaga atattgataa gttattgggt tgagagtttg tgtaggaggg 6360ggttggaggg gaagtttttt agaatgaaat tatttttttt tcgaagttaa ggtatttttt 6420ttaataaaat ggtttatttg tttagtaaag aaaatataat ttttgttgta aattagtatg 6480atttttttta aaaacgtgat tggaagatag tggttattta gttataagat attgagttta 6540gaggggaatt tgatgaatat ttggttttta ttgtaagaaa tgggattgta tatattttaa 6600ttttaatttt atattgaagt taaattttgg gtatgtattt gtgaaaggtg gaagaaaatt 6660ttattaagtt taaggtgaag aagttagatg agtaattaat ggtttttatt ttttaaagat 6720ggattaaatg taaattgtta gaaaataata aatgatataa gtagagtatt tgttagttta 6780tttgtgttta tttttttgga tttgaggtat aaaggattat tttaaatata ggagagtaaa 6840taaagtaggt gttttgtttt ttggtatagt taaaaggtaa attatttgta attttagtat 6900tttgggaggt taacgtaggt agattatttg agtttaggag tttgagatta gtttgggtaa 6960tatggtaaaa ttttattttt ataaataata aaaaaaaatt agttaggtat ggtggtgtat 7020gtttgaggtt ttagttattc gggaggttga agtgggaaga ttgtttgagt tttagtggtt 7080gaggttgtag tgagttatga ttattgtatt ttagtttgag aggaagaatt tgttttaaaa 7140aaaaaaaaaa aaaaaaaaaa gaattaaaaa atgaaaaata ggttgggtat ggtggtttat 7200atttgtaatt ttagtatttt gggaggttaa ggcgagtaga ttattttagg ttaggagttc 7260gtgattagtt tggttaatat ggtgaaattt cgtttttatt aaaaatataa aaattagttg 7320ggtgtggtag tgtgtatttg tagttttagt tattcgggag gttgaggtag aagaatcgtt 7380tgaatttggg taggcggagg ttgtagtgag tcgagattgt tttattagat tttagtttgg 7440gtaatagagt aagattttat tttaaaaaaa aaagaaaagg tagattagtt taataattta 7500atggaattta atatttgtta tattggggta aaaataaaag tttgtttttt aaaaattttt 7560ttaagtgatg ttattaagtt aagttttaaa atatataatt tattttaaga ttgatattta 7620aagtttaaat gaattttttt tttgttattt gaatgtggtt tttaaagtgt taagaagtta 7680tttgtttttt aaagtaaata agagatttgg attggcgttt tggaaaagta agtataaata 7740tgtttttgga ttagaggttg gtttagtaat attgagtgta attattggtt gggtattgtg 7800taggtattag gattaatata taattttgta attgtaggag tttatatttt agtagggtag 7860ataaacggat aatagataaa tattttttta gttatagata tatattatat gtatatagat 7920ggaagagaag tgtgtataag tagaagtggt taggttttgt tataaagttt ttatagagaa 7980ggggttattg agtagggttt ttaagtatga ataggagttt attaggagaa aaataatggt 8040ggaatgggaa taatttaggt agaaagaaga gtatgtggaa tggaatggga tggaagtgag 8100gaagcgtatg gtatgaatga aaaaatataa gagttttata ggttattttc gtataagagt 8160tgatgatttt atattttcga gtgtagttgt tttatttatt attatattat tttttttata 8220aattgttatt ttattacgag ttgatttagg agttttaatt tagaaatcgt gtttataatt 8280tagattattt ttttgtaaat tatatgttga aaagagtgag ttaagaaaat atatttgggg 8340ataggcgtgg tggtttatgt ttgtaatttt agtattttgg aggttaaggt gggtagatta 8400tttgaggtta ggagtttaag attagtttgg ttaatatggt gaaatttcgt t 8451 15 6699DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 15aattttagaa gggtatttga agattaaagt aaaaaaaata agaagatttt ttggagtaga 60ttttaaatgt ttttttttta gtttttttaa agttgtatta gttttagtgt taatttaagt 120tgagattatt ttaaatattt ggagaaagtt ggtatttaat ttagttggag ttagtgtttt 180gtagttgttt tttaatgaaa gaatttattt tattgggaga tgttgagtag taataatata 240gttgtttaaa attagtaaaa attttaaaat gattcgtaag ggatagtgta gaggttgttt 300ttataagatt ttgtaattta tttgaaatta aagattgtaa agtattaaag agggagtttt 360ggttatttta gtttgggtta ttagagtggt attgaataat tgattaagga ttttggttgt 420gttaggtatt gtgttaggga tatattggtg ggtaaaatag attttttgtt tttaaggagt 480taatagttat ataagtaggt aattttaggg aatataggtt attgtgggat taggttagtt 540ttatagtatt ttagatttag aaagtaaatt ttattagttt atttggaatt gattaggtag 600ttaggaaaaa gagaatatta agaagggaaa tataattagg aagtaagaat tgagttagaa 660tttattatat tttgagggat aagttagaat gtttattatt attattatta ttattaatat 720ttttgagata gagttttttt tttgttgttt aggttggagt gtagtggtat gatttcggtt 780tagggtaatt tttatttttt gggtttaagt aatttttttg ttttagtttt tagagtagtt 840gggattatag gtgtgtatta atacgtttgg ttaatttttg tatttttagt agagacgggg 900ttttgttata tttgttaggt tggttttaga tgggtttaag taattttttt gttttaattt 960ttcgagtagt tgggattata ggtgtgtatt aatatatttg gttaattttt gtatttttag 1020tagagatggg gttttgttat gtttgttagg ttggttttaa atttttgatt ttaggtgatt 1080tatttatttt agttttttag agtgttgaga ttataggtgt gaattattat atttagtaga 1140atattgattt aatattttat aatgagattt ttattttttt agttattaga ttatttgtgt 1200ttagtttgta gggtaatttt tttatgttaa ggtttttagg gatgagtttg gtgagtttat 1260aagttagagg aggtgaatag ttttgaggga tattttataa aaatttatag aattattttt 1320gtttttaata gatttaattt ttttagaggt tagaatattt tgattttatt tttaggtaga 1380tttggatgaa tagatttcga taggttggtt atttaggttt tttttttaaa aattttatgt 1440tgataattat attttgtaaa tgtagttttt taaatatgtt ttttgtttat taggtaattt 1500atttacgtgt ttaaaggtat aataaggttt atagtggaaa atttttttta tttttgtttt 1560ttagttattt aggttttttt tttagggata atttaggtta ttagtatttg tgtatttttt 1620taaatatatt ttattgatgt agtttaaata atatttttta aaaaaattgt agttttattt 1680atattttagg tatgagaata tattttagtt attttgtttg aatttgagta atatattatt 1740gtttttaatt tattttgaga gatatttttt ttttaaattg taggtataaa tgttttttag 1800aataggtgat ttttgtagat agttaatttt atttagtgta tttgtgtgta tatgtgtgtg 1860tttaattaat tttatagagt atttgtattt ttaagtttta ggaatatttt tttttgtatt 1920tgtttatgtt ttatgtatag attttgaagt taattatgat atagaaataa taaattttta 1980taacgggttt ttttgttgtt tattttgtta atttaatgat tttatttgtt tttttaattt 2040taagatatat tttaaaaatt ttgtgttttg ttggttggaa ttagggagag ttgggtatat 2100ttcgaaagta atagtgatga ggaagaattg aaaagttgaa tttttgttat gtttttggta 2160tgttttttat tttttgtttt tttagatttt tttatatata tattatttta aattatgttt 2220ttaagttaag ttataaagat gaattattat tagatttgaa tatgtataac gattaggtat 2280gagattatta agattttaaa attattggtt taattaaagt atttaatggt atttattgtt 2340aataggggaa ggtaagataa gattttatag tttattttat tttttttgaa taaggtagta 2400attaaagatt acggagttgt taattattat tatatagata ttttgtagag ttggtttagt 2460attagataaa taatttaata tggaaagttt gtattttaaa ttgatgaggt tattttagaa 2520attgttatta aattttttta aaaatagaat atagaagaga atgaaaaaat ataattgtag 2580tgaatgaata aaagtgtggt ataaaagggg aaaaaggata aagaatgaaa gtaaattaga 2640ggtatagtaa aaaggaggag tgagtgtttt gatttgtttt tataatagta ggattggttt 2700gggtggcgtt atttatatat tttttgttgg attttaggag ataagggtat gttttttggt 2760tatgagtttt ttattatgta aaatttaata atatcgtaaa ttttattatt attagatatt 2820tttaattttt atatttgtaa aattaaaata gtgtttttaa tgggtggtaa gaggatgttt 2880tttaatttta agtagaaatg gtatagtaat tttaagggtt tgttatgtgt atttattgta 2940ttttttagtt ttttttagga gaagtatatt tttggttgtt tttagtatat taagagaatt 3000agattttaga ggtggttgta ttttattgtt gggagtaagt attttttaaa ttttgagaaa 3060tgttagagat tttttaaaat tttattagaa gtatgaagtt ttgattagaa agataaaggg 3120atttggtttt aggttatata gtaaattaag tggtagaatt aagttatgaa tttagattta 3180ttttttttat tatattatgg tatttggggg tttttttatt gttagagtag taatatatta 3240ttttatatag tttttttttt tttttttttt ttagatggag ttttgttttg tcgtttaggt 3300tggagtgtag tggttcgatt ttagtttagt agttgggatt ataggtattt attattatgt 3360tcggtttttt tttttttttt tttttttttt ttttgagacg gagtttagtt ttgtcgttta 3420ggttggagtg tagtggcgtt atttcgtttt attataagtt tcgtttttcg ggtttacgtt 3480atttttttgt tttagttttt cgagtagttg agattatagg cgttcgttat tacgttcggt 3540taattttttt ttgtattttt agtagagacg gggttttatt atgttagtta ggatggtttt 3600gattttttaa tttcgtgatt cgttcgtttc ggttttttaa agtgttggga ttataagtat 3660gagttatcgc gttcgattta gtttttgtat ttttagtaga tagggtttta ttatgttgat 3720taggatagtt ttaaattttt gattttaggt aattcgtttg tttcggtttt tttaattgtt 3780gggattatag gcgtgagtta ttgtattcgg ttttatatag ttttaatgtt acgtattaag 3840ttttgtatgt ataatttttt attttggttt tttagtaatt ttttatgtgt tagggatagt 3900aaattttatt gtttttattt tgtagataag aagattgtaa tttaggaaga tatatagtag 3960tttataagtg atttaggatt ggaatttagt tattttaatt ttttttcgga ggtttttttt 4020attatgttat ttgttcgttt ggtgtttttt atttatgaat tttggaaaat aagtttgaga 4080tattaaaatt gaaaagatag tttattaaaa atgaatagtt ataattttat aagtataaaa 4140atgaaatatt taaatttttt gttttttttt ttgttaggag tataaatgtt aatttgagtt 4200ttttagtttt gtataaattt atagtaatta agattgtatt gtgagggaaa atattttttt 4260aaaaaagaat tttgattaag ttgaaataaa aattttaaaa tatgaaatgg aaggaacgaa 4320attgtcgttt ttttttattt ttgatttata tttgtcgatt tttatgacgg agttttttaa 4380gttaggggta tatggttaaa gattatgtga aatgttaggt gttttaaata ataatcgacg 4440gggtattgga aggaaagtat tgttttttcg gggaataaat ggtttaattt ttagatttag 4500ttttttgtag ttttaaattc gatgttgtat taagaaatta tttaattttt aggtggtttc 4560gtttatcgaa aaatgaggtg attggtttag tgcgtatatg tgaatttaag ggtaatattg 4620tatttacgtt ttgtatattt aaatttttaa atatttattt aatatatgta tagattattg 4680ttatttcgtt agaagtcgcg ttttgtttag ttgcgcgaga ttttaacggg tttttttgcg 4740acgttcgggt ttgggttcgg gttcggacgt gtaatagaag tcgttagtgg tttcgttggt 4800taaaaaaggg taagtatcgg aggttcgagt tagcggtcgc ggcgtttttc gatagttttt 4860aattcggggc gttacgtcgg ttttattatt tgttttcggt agttaatggg gtcgcggggg 4920gcggtcgggg cggagcgcgg ttataaaagg tttcgggttt cgcgcgttcg tttatttcgt 4980ttcgggcgcg ttttcgggaa ggtttggatc gacgcggttt agaggttagg aatagttcgc 5040gcgtggatta gtcgggttag ggcgatgttg cgggtgcggt gtttgcgcgg cgggagtcgc 5100ggcgtcgagg cggtgtatta tatcggattt cgggtgcgtg cgttatcggt ttcgtttggc 5160ggtcgcgtga tttattcgat tttgcgggcg gcgtggagta ttcgttcgtt ttttgttcgg 5220agtcgttatt ttttttcgtt ttttttagtc ggaattgtac gagagtgttt tttttggtat 5280ttttgggaag tttagtttta agagttttcg taggttttag gagttgggcg gcgtttttta 5340gttaggggga atttgcgttg cggttttagt ttttggggtt tatttgttgt ttgcgcgttc 5400gcggtttgtt ggtttacggc gtagggggcg tcgttttttt ttatcggatt ttggtgcgtt 5460gtattaagtt tttcgttcgg agtaaggggt tgggacgacg gaggtttttt ttagtaaaag 5520ggtggcgtta ttggggttta gtagtttgag tgggcgtcga gttggggaga tttttggaaa 5580atgcgtgtgg ggtagatgga tggggagaag aggtaagtaa agtgggaatc ggggacgggg 5640agcgagcgat tagatttatt ttaagtataa tatgggattt tacgtttgga gaggagtcgg 5700ggcgagtgta gtttgtaagt agagtttttg cgtttttcgt tttcggttgt tttggtagta 5760gattttttta tgtttttagt attggaatcg tttcgatatt ttggtttttt tttagtaatt 5820ggtttttgaa tagttgttat ttttcgtttt ttttttgttt ttattcgagt tttttttttg 5880tttatttttt aaggttttta atagagtagg atagagattt ggggggttga ggtttgttta 5940ggggttgagg gatttttttt gttttagatt ttataggtta tgtattttta aaaggttttt 6000gaagttttta gatttttttt ttatttgttt gaatttacgt ttgagttaat tttgattttg 6060gttagggtat tgtggattat ttgtaaaatg gagtagatgg tagttgttta tttttagaat 6120tgaagtgtta aagaatgcga agtgtatgtt aaagatgaaa aaaatttgat ttgaagttgg 6180ttattttgaa agataaggtt ttttataaat gtttttaatt ttttatttgt aaaaaaaaat 6240aaataaaaag tttaatattg gtaatttttg atatttaagg gaaaaggagg tttcgttttt 6300agttgagatt ggcgggaagt tttagagtag ttgtttatgg ttttttgaga ggaggattga 6360tttatttgta aaatagttgt ttaaagtttg agtgtaggaa ttgtattttg agataaagat 6420gggggtgtat ggtagttggg gatacggttt tttgaggagt tttaaagagt tatagtaatt 6480aatagataag aagataattt gtagataaat aagagggtta aaaaaattat ttgtaatttt 6540attatttatt tatatattgt taacgttttg gtttatgttg ttttaaaggg gtttaagtgg 6600taatgttatg ttggattttt attttatttt tatttttttt tttttgtaag tattgataga 6660gtaatgtaat ataataattt tttttttgtt tttggaagt 6699 16 6699 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 16 gtttttaagaataaagaaaa gattattgta ttgtattgtt ttattagtat ttatagagag 60 gaggaagtggagatggagta aaaatttagt ataatattgt tatttaaatt tttttagaat 120 agtataaattaagacgttaa tagtgtgtag gtgggtagtg ggattataga taattttttt 180 aatttttttgtttatttata aattgttttt ttatttatta attgttgtaa ttttttaaaa 240 ttttttagaagatcgtgttt ttagttatta tatattttta tttttatttt agaatgtaat 300 ttttgtatttaagttttaag taattgtttt gtagatgggt tagttttttt tttagaaaat 360 tatagatagttgttttaaaa tttttcgtta gttttagttg gggacggaat tttttttttt 420 tttaagtattaaaggttatt aatattaggt tttttattta ttttttttta taaatgaaaa 480 gttgggaatatttgtaaagg attttatttt ttagaataat tagttttaaa ttaaattttt 540 tttatttttgatatatattt cgtatttttt ggtattttaa ttttgagagt gagtaattgt 600 tatttgttttattttataga tggtttatag tattttagtt aaggttagga ttagtttagg 660 cgtaaatttaaataaataag aaggagattt aaaaatttta aaagtttttt aaaaatgtat 720 ggtttataaaatttagagta gggagggttt tttaattttt gagtaaattt taatttttta 780 aatttttattttgttttgtt aaaagtttta ggaagtgggt aggaggagaa ttcgggtgga 840 ggtagaagaaagacggagaa tgatagttgt ttaggaatta gttgttggga ggaagttaga 900 atgtcggagcgattttagta ttagaagtat gggagggttt gttgttaggg tagtcgaggg 960 cggggagcgtagaaattttg tttataggtt gtattcgttt cgattttttt ttagacgtgg 1020 gattttatgttatatttgga gtgaatttgg tcgttcgttt ttcgttttcg atttttattt 1080 tgtttgttttttttttttat ttatttattt tatacgtatt ttttagaaat ttttttaatt 1140 cgacgtttatttaggttatt gaattttaat aacgttattt ttttattaag aggagttttc 1200 gtcgttttaattttttgttt cgagcgggaa gtttggtgta gcgtattaag gttcggtaga 1260 ggggggcggcgttttttgcg tcgtgggtta gtaggtcgcg gacgcgtaga tagtaagtag 1320 attttaagggttggagtcgt aacgtaagtt ttttttgatt gggggacgtc gtttagtttt 1380 tggagtttgcgaaggttttt gaagttgagt tttttaggga tattagaagg gatattttcg 1440 tgtaatttcggttagggaaa gcgagggaag gtggcggttt cgggtaggga gcgagcgagt 1500 gttttacgtcgttcgtagga tcgagtgagt tacgcggtcg ttagacgagg tcggtggcgt 1560 acgtattcgagattcgatgt agtgtatcgt ttcggcgtcg cggttttcgt cgcgtagata 1620 tcgtattcgtagtatcgttt tggttcggtt ggtttacgcg cggattgttt ttggtttttg 1680 ggtcgcgtcggtttaagttt tttcgagagc gcgttcggag cggggtgggc gggcgcgcgg 1740 ggttcgaggttttttgtagt cgcgtttcgt ttcggtcgtt tttcgcggtt ttattggttg 1800 tcgggaataggtggtggggt cggcgtagcg tttcgaatta ggaattgtcg ggaagcgtcg 1860 cggtcgttggttcgagtttt cgatgtttgt ttttttttag ttagcggggt tattgacggt 1920 ttttgttgtacgttcggatt cggatttaga ttcgagcgtc gtaagaaggt tcgttggagt 1980 ttcgcgtaattgggtaggac gcgatttttg acgaagtgat aatggtttat gtatatatta 2040 agtgaatatttgagaattta aatatgtaaa gcgtgagtat agtgttattt ttaaatttat 2100 atatgcgtattgaattagtt attttatttt tcggtaaacg aaattattta aagattaggt 2160 ggttttttggtgtaatatcg ggtttgagat tgtagaaaat taagtttgga aattgggtta 2220 tttgtttttcggggaggtag tgtttttttt ttagtatttc gtcggttgtt atttggaata 2280 tttggtattttatatggttt ttggttatat gtttttggtt tgagaaattt cgttatgaaa 2340 atcgataagtgtgggttaga aataagggag gacgatagtt tcgttttttt tattttatgt 2400 tttaaaatttttgttttaat ttgattagga ttttttttta gaaaagtatt tttttttata 2460 gtgtagttttaattgttgtg gatttgtata gagttagaga atttaggtta atatttatgt 2520 ttttagtaggagggggggta agagatttga gtattttatt tttgtattta tagaattata 2580 attatttatttttgatgagt tgttttttta attttggtat tttaagtttg ttttttagag 2640 tttatggatggaaagtatta gacgagtaga tggtatggtg gaaagagttt tcgagaggga 2700 attaggataattgagtttta gttttgaatt atttatagat tattatatgt ttttttgaat 2760 tgtagtttttttatttgtaa agtgagaata atagaattta ttgtttttag tatatggggg 2820 gttgttgagaggttaaaatg agagattgta tatgtagaat ttgatgcgtg gtattagagt 2880 tgtatgaggtcgggtgtagt ggtttacgtt tgtaatttta gtaattggga aggtcgaggt 2940 aggcggattgtttgaggtta ggagtttgag attattttgg ttaatatgat gaaattttgt 3000 ttattaaaaatataaaaatt aggtcgggcg cggtggttta tgtttgtaat tttagtattt 3060 tgggaggtcgaggcgggcgg attacgaggt taggagatta agattatttt ggttaatatg 3120 gtgaaatttcgtttttatta aaaatataaa aaaaaattag tcgggcgtgg tggcgggcgt 3180 ttgtagttttagttattcgg gaggttgagg taggagaatg gcgtgaattc gggaggcgga 3240 gtttgtagtgaggcgagatg gcgttattgt attttagttt gggcgataga gttagatttc 3300 gttttaaaaaaaaaaaaaaa aaaaaaaaaa aaaagtcggg tatggtggtg ggtgtttgta 3360 attttagttattgagttgag atcgagttat tatattttag tttgggcgat agagtaagat 3420 tttatttggggaaaaaaaaa aaaaaaaagt tatatgaggt aatgtgttat tattttagta 3480 ataaggaggtttttaaatgt tataatatgg tgaaaggagt aagtttaggt ttataattta 3540 attttgttatttaatttgtt gtgtgatttg gaattaaatt tttttatttt tttaattaag 3600 gttttatatttttagtgagg ttttgggaaa tttttaatat tttttaaaat ttaaaaagta 3660 tttatttttaataataaaat gtagttattt ttgaggtttg atttttttag tgtattgagg 3720 gtagttagagatgtgttttt tttgaaaaga attgaagagt atagtaagta tatataataa 3780 gtttttgagattattatatt atttttgttt gagattggag gatatttttt tgttatttat 3840 taaaagtattattttaattt tgtagatgta agaattggga gtgtttggta ataatgaagt 3900 ttacgatgttgttaagtttt atataatgaa aaatttatag ttaaagagta tatttttatt 3960 ttttgggatttagtagaaag tgtgtggata gcgttattta aattagtttt attgttataa 4020 aagtaaattaaagtatttat tttttttttt tgttatgttt ttgatttatt tttatttttt 4080 gttttttttttttttttata ttatattttt atttatttat tataattata tttttttatt 4140 tttttttatgttttgttttt gaaaaaattt ggtaataatt tttagagtga ttttattaat 4200 ttaaagtataagttttttat attagattgt ttgtttaata ttgggttaat tttgtaaagt 4260 atttatatagtgatagttgg taatttcgtg gtttttagtt gttgttttat ttagaagaaa 4320 tggaatagattgtgaagttt tgttttgttt ttttttattg gtagtagata ttattaaata 4380 ttttgattgaattaataatt ttaggatttt ggtggtttta tatttagtcg ttatgtatat 4440 ttaagtttaatagtagttta tttttgtagt ttaatttaaa ggtataattt aggatagtgt 4500 gtgtataaaggggtttaaaa ggatagggaa tagaaaatat attagaagta tggtaaaaat 4560 ttagttttttaatttttttt tattattgtt gttttcgaga tatgtttaat tttttttagt 4620 tttaattaataaagtataga gtttttgaaa tgtgttttga aattaaaaaa gtaagtaaag 4680 ttattggattaataaaataa ataataaaag agttcgttgt aagaatttat tatttttata 4740 ttatggttgattttagaatt tgtatatagg gtataaataa gtatagagga aggtgttttt 4800 agaatttaagaatatagata ttttgtgaaa ttggttaagt atatatatat atatatagat 4860 atattggatgagattagtta tttatagaag ttatttattt taagagatat ttgtatttat 4920 agtttaggggaaggatattt tttaaagtaa attagaaata ataatgtatt atttaagttt 4980 aaataaggtgattaaagtat atttttatgt ttggaatgta aataaagttg taattttttt 5040 agaaaatattatttgggttg tattaataaa atatatttgg aaggatatat agatattgat 5100 aatttaagttgtttttgggg aggggatttg gatgattagg aaataggaat gagagagatt 5160 ttttattgtaagttttattg tatttttgaa tacgtgagtg aattatttaa taaataaaaa 5220 atatatttaaaagattgtat ttgtagggtg tgattattaa tatggagttt ttaaaaagga 5280 agtttgagtggttaatttat cggagtttgt ttatttagat ttatttaagg atggaattag 5340 aatattttggtttttggaaa ggttaaattt attgaggata agaataattt tgtgggtttt 5400 tatgaaatattttttaaaat tatttatttt ttttaatttg tgagtttatt aagtttattt 5460 ttgggaattttggtataggg gagttatttt gtaggttgag tataagtgat ttgatagttg 5520 gaaagatgaagattttattg taaagtatta aattagtatt ttgttgggtg tggtggttta 5580 tatttgtaattttagtattt tgggaggttg aggtgggtgg attatttgag gttagaagtt 5640 tgagattagtttggtaaata tggtaaaatt ttatttttat taaaaatata aaaattagtt 5700 aggtgtgttggtgtatattt gtaattttag ttattcggga ggttgaggta ggagaattgt 5760 ttgaatttatttgagattag tttggtaaat atggtaaaat ttcgttttta ttaaaaatat 5820 aaaaattagttaggcgtgtt ggtgtatatt tgtaatttta gttattttgg aggttgaggt 5880 aggagaattgtttgaattta ggaggtggag gttgttttga gtcgagatta tattattgta 5940 ttttagtttgggtaatagga gagaaatttt gttttaaaaa tattagtaat aataataata 6000 ataataaatattttagttta ttttttagag tgtggtgagt tttagtttag tttttgtttt 6060 ttaattatgttttttttttt aatgtttttt tttttttgat tatttagtta attttaggta 6120 aattgatggaatttattttt taaatttgaa atgttgtggg attggtttga ttttataata 6180 gtttgtgttttttggaattg tttgtttata tggttgttgg ttttttaagg atagggagtt 6240 tgttttatttattagtatat ttttagtata gtgtttgata tagttagagt ttttaattaa 6300 ttgtttaatgttattttgat ggtttaggtt agaataatta gagttttttt tttggtattt 6360 tgtagtttttgattttaaat gagttataaa attttgtgaa ggtagttttt gtattgtttt 6420 ttacgagttattttaggatt tttattagtt ttgaatagtt gtgttattat tgtttaatat 6480 tttttaatgaggtagatttt tttattggaa gataattgta aaatattagt tttagttaaa 6540 ttaaatgttagtttttttta agtatttaaa ataattttag tttaggttag tattgaaatt 6600 gatatagttttaagaaaatt gaggaagaaa tatttgaagt ttgttttaag ggattttttt 6660 attttttttattttagtttt taaatatttt tttggaatt 6699 17 6177 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 17 gttttggttg tttggttaagggtggtttgg aggttagagt aattagagaa tattattggt 60 tatttttgta gagaattaacgtttagtaag gattgagttt ttagttttgg tttttttttt 120 ttaggttgtg ggttaggattatggaggagg ggatatttta gttttgtata gtttgttttt 180 ggtttggagt tgttttgagtagtgtagttt attgatttta tttagtatgt attgggtgat 240 tattatttat tattaagagttagggtatat taagttatta taaggtggtt tttacgtttt 300 tttgacgttt ttagggtacgtttttttatt ttcgtttttt ttatttatga ggatttattg 360 taaatttttt ttaattatgtatatgagatt aggattttat atagttttta aatttatatt 420 tattgtgtaa ggttatagttattttgtagt ttaagataaa taggatattt ttttgtattt 480 atttattttg gtttaagtttttatatggat tgaatgtttg tgttttttta aaatttatat 540 gttgaagttt tattttttagtgtgatggta ttaggaggtg gggtttttag ggattattaa 600 gttatgggat ggagtttttttgaatgggat tagtgttttt ataagaagag ataagaacga 660 gatgattttt tttttttttttttatgtgag gatataaaga gaaaatggtt tttattaaga 720 atttgattat gttggtatttggatttcgga tttttgtgtt ttttagttgt gagaaatgaa 780 tgtttgttgt ttaaattatttagttttata gtagtttaaa ttgataaatt ttttttcggg 840 atgattgttt ttattttttcgttttttgtt tttgattttg ggaagtggat tttgaggaag 900 ggttaagtgg gtatattggggagtgatttt tataagtgta aaaggggagg aagtaggatt 960 gagtaataag atgtgttttagggagtttag aagtagagat tgtttatgcg ggtagttttg 1020 tatcggatag taatggcgaggttttgatta ttttttggtt tagttatggt ttgaggttat 1080 tttaagaaga atatggttatttagatagta gaagtatatt tggaagtgtt gataggtgaa 1140 ggtagttagt tggttagtttttatatcgtt atatagtaag ttttatattg aagggggatg 1200 tttgtttgtt atttatttttgtagtttatt tttagtatag tagttggggt gattttgtta 1260 aaatttaagt taggttatgttatttttttg ttttaaattt ttaaagatat tttatatagg 1320 tttttaaggg ttcgtaagatttgttttatt cgtatttcgt ttgttgtttt tttaaattta 1380 tttcgttttt tttatttgttgtaattatat tgattttttg ttgtttttta agttaggaaa 1440 tattaggtat attttttttttagggttttt gtattttagg ttttttttgt ttgaaatgtt 1500 gtgtttttag atagttacggggtttttttt ttgtttttag ggtttgtatt aaatgttagt 1560 tgtttagtga ggcgttttttttttttttat tagaaattga ggtcggttat agtgatttac 1620 gtttataatt ttagtattttgggaggtcga ggcgggtgga ttatgaggtt aagagatcga 1680 gattattttg gttaatatagtgaaatttcg tttttattaa aaatataaaa attagttggg 1740 cgtggtggta tgcgtttgtagttttagtta tttgagaggt tgaggtagga gaatcgtttg 1800 aatttgggag gtggaggttgtagtgagtta agatcgtatt attgtatttt agtttgggta 1860 atagagtaag attttattttaaaaaaaaaa aaaaataaaa gaaattgaaa tttgttattt 1920 ttgtattttt atttttttttattttatttt ttttagagta tttattatcg tttaatatgt 1980 tttatatttt gttagaatgtaaaattttcg aggataggga tttttttgtt gttgtttttt 2040 ggttattttt attgtttaggatggtattat agtatatagg aggtgtttag taattattgt 2100 ttttaatagt aaaaattataattatttttg tattaaatta aatatttgtt aaattaataa 2160 atttatatat agatttggtgttttgttagg tggtggagat ataaagattt agttgtttgt 2220 ttttaaaggg tttatagtttaatggaggag gggaataaag ataagtagat tatgtattaa 2280 ggaatgggga aaggggagtggtttattaga gatagagttt tagttttgta agatggtaaa 2340 gttttggaga tttgttgtaaaataacgtga atatatttaa tattattgaa ttgtatattt 2400 aaaattttta agatgatatattttatggta gttgtttttt aatataatta aaaattttta 2460 aataataaaa ataaagtattatgggtagta gttgagttgt tgaaagtata aaggtatatt 2520 tagtatagag ggagttagtaaggggatttt tgggagaagg taataattga gaaaagtttt 2580 gatttatagc gtttagtacgtgagggtgtt ttatgtagag ggaatagtag ggataaaggt 2640 aagagcgtat agagaattttattagtgaga tttggttggg ttatagcgag aagggtgagg 2700 ggtaaggttg gagaagtggttagggattgg aggttgggga gtttagggtt tatttagaag 2760 gtgataggga gttatagatgattttttagt agggcgatgt tggttagatt tttagggaag 2820 tgtggaggtt gagttggaagggtggggtta gaggttaaga gattagttgg gaggttattg 2880 aggtggtagt agtttgaataggattagggt aaagggaatg tagggaagta tgtggtttta 2940 gggatatttt taggtggaatgattaggttg tggtaattgt tgttttagtt gattttagtt 3000 tttttatttt ttggggaggaggtcgagtta tttaaatttt taaagttttt gaggaaggag 3060 ttagagtagg gtgagggtagttttgacgtt attttttagt tttttattgg tttttttttt 3120 ttttttagta tattgaattagaaaggtttt gggagagttg ggtttagttt taagagagga 3180 aaattcggta gtgagtagaggttgtagtgg gggcgtggtg agaattagtt tttaggggtt 3240 tcggttttta tgtttttaagggttagaatt aagtggggta gttgttagtt ttagaaattt 3300 aggagattta gtttagtttggttttgaggg agaggtttag aggggaagtt agtttagtcg 3360 gattttttag ggtagttagttttgaagttt ttaggtttgc gtgtttttaa agatgttttt 3420 ttgttggttt tgaagatagaatttttaggg attcggtttt ggggtttagg gaatttaagg 3480 attaaatttt gttgtggaggaatagggatt tttgtgttat tagttttagg ttttaatagt 3540 tttttgttat tttttttttttttagttgcg ttagttttta ttatttttta agaataattt 3600 atagattttt tttgttatagtattataatg tttttagtta ttatttattt gaaaaatttt 3660 atgtattatt attatattatgtgttttgat tatattgtat gttattaatt ttataaagta 3720 gatattatta ttatttttattttgtagagg aagaaattga ggtataggga tttgagtaat 3780 ttgtttaagg gtataggagttaatagtaaa gttttagttt ttgggtttag ttattaataa 3840 cgttttagta tttcgagggtagtggttata gttttagaat tttatagttt taggttttcg 3900 agttatattt atgtcgtttttttatttaga atgttttttt tttttatttg gttaatggag 3960 ggggaaaagt atttttttttttttaggaaa tgtttttaat taagtttttt gggaattatt 4020 tagtattttt taggagaattttttatattt attattttat cgttatttaa gggttgatat 4080 gtttaatttt tgtattagttagtgagggag gaggttagag attaagtttg gttggttttt 4140 tagggtattt ttaggtttttaagtagcgtt tgtagtatag tagatgttta ttgatgttta 4200 tttatttgtg atgtttgaatgtatgaaggt aggtttcgta tagttttttt atttttatgg 4260 atgtttttta tattatttagttattattta gaggtataag aacggggttt aagttaaagg 4320 ttaggtggtt tttttatttttagttttaag gagtttatgg gaattgttta atggtttttg 4380 attgtgtagt ttgtttagatatggggatgt ttgagaattt tggaagaacg tgggttgggc 4440 gtggatagag acgtttgttttattatgtat gttggaggtg tggattataa tttttgtttt 4500 ttattggagt ttttcgcgtcgtaattagtt ttgatcgttt tattttggta tattagggtt 4560 agttatttag taaatgagtggtttttatat tttattttta ttcgtttatt ttttatagtt 4620 tcgtaggtta gttgtttagatttatagttt ttattgtaat ttttttaaat ttagttattt 4680 tgagagattt tggtttgggagaattttttt tttttggtta aagaaacgat aggagagttt 4740 attgtttgga atatttggtggagagagaat agaggagagg aagggtaggt tagttttttt 4800 tgtttttttt tatcgtaaattatataggtt tattttttcg gagtgggttt agggagtttg 4860 tattttttag ttttcgttttcgtttttttt ttagcgttcg tcgttttttt cgtcgcgttt 4920 tttgttttta tttcgtttttttgcgttatt taaggcgttt tcgtcgttcg tgcggtttag 4980 tagggttttc gcgggcgttatttcggttat cgtttttatt tttatttggg tcgttcggta 5040 ggtaggcggt gagtcgggggttaggaaggg attaggggcg ttatttgttc gcgggaggtc 5100 gggaggagtt ttgggtttttcgatgtcggg acgggggttg ttgcggaacg ttcgtcgcga 5160 tagagtcgcg tttatttaggtggttttggt taggttttta tttttttttt atggaatttt 5220 tgtaataatt cgaggcgggaggaatattat tgtttttatt ttatcgtgga ggagattgag 5280 gggtttagag gttgttttttatttaagggg tcgtagttat taaaaggtaa gatttgaatt 5340 tagggtcgtt tttagagtttggttttaaat agttttgtat ttgggaagag gtattttttt 5400 tttgggaatt ttgtggtttgtgttttattt tgtaatgata atttttttta agagtttaga 5460 atttgttagt attagttttggaggtggaag ggggtgggag tggaggtgga ggaagaagat 5520 aggattaaat gtttttttttaagtggtagg tggttattat tgttgatcgg tggagttaaa 5580 ggatgatgtt gtttttagtttttaaaattt tttttattat ttagtttttg taggtttaaa 5640 gattagagtg aagttagttgggtaagatat gaggcgggga gtagggattt gaggttttga 5700 gttttttaag aagtagaagataatattttt attattatta ttagttttta ttgtttgggg 5760 gtagttagtt ttgggtaaaagggaggaagg gtttagttta gttgtataat tttggataag 5820 ttttttaaat tttgtttttataggtaaagg agttttaatt ttatttagat ttttttggtt 5880 tgtgtttatt ttggggtagtggttcgggga taagagggat atagatgttt gattaggtag 5940 ggattttagt taaagtagaatgagattata taaagaggtg ggtagttatt atttaaaaat 6000 ttgggttggg ttttgtttgtattgttgagt gggagttttt aggttagttt tttttttttt 6060 tgagtttggg tttttttgtaggtagaacgg gcgtggtaga tttttttgta ggtttgttgt 6120 tgggcgaacg agaaggatgttatgttgata tattgacgtg ttttgttttt ttgtaga 6177 18 6177 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 18 tttgtaaggagatagagtac gttagtgtgt tagtatggta tttttttcgt tcgtttagta 60 ataagtttgtagggaggttt gttacgttcg ttttatttat aaagaaattt aggtttagga 120 aggggaaggattggtttgga ggtttttatt tagtagtgta ggtaggattt aatttagatt 180 tttggatgatggttgtttat ttttttgtat ggttttattt tgttttggtt aaggtttttg 240 tttaattagatatttatgtt ttttttgttt tcgagttatt gttttaggat ggatataggt 300 taaggaaatttgggtggagt tgaggttttt ttgtttatgg gaatagaatt tgaggaattt 360 atttaaagttgtgtagttgg gttaagtttt tttttttttt tgtttaaggt tggttatttt 420 tagatagtgggagttagtga tgatggtaga ggtgttattt tttgtttttt agggggttta 480 aagttttaggtttttgtttt tcgttttata ttttatttag ttggttttat tttaattttt 540 gagtttgtaggggttgggta gtggaagggg ttttaggagt tgaaggtagt attatttttt 600 agttttatcggttagtaata atgattattt gttatttgag gagggatatt tggttttgtt 660 ttttttttttatttttattt ttattttttt ttatttttaa agttgatgtt ggtaaatttt 720 agatttttgaaaggaattgt tattgtaggg tgaggtatag gttataaagt ttttaagggg 780 gaggtgtttttttttaagtg taaagttgtt tagagttagg ttttggaagc ggttttgggt 840 ttaaattttgttttttagta attgcggttt tttggataag gaataatttt tgggtttttt 900 agttttttttacgatagagt ggaaataata gtattttttt cgtttcgggt tgttataagg 960 attttatggaaagagggtgg gagtttggtt aaggttattt gggtgagcgc ggttttgtcg 1020 cggcgggcgtttcgtagtaa ttttcgtttc ggtatcggag gatttaagat ttttttcggt 1080 ttttcgcgagtaggtggcgt ttttggtttt tttttagttt tcgatttatc gtttgtttgt 1140 cgggcggtttaggtggaggt ggggacgatg gtcggagtga cgttcgcggg agttttgttg 1200 gatcgtacgagcggcggggg cgttttaaat agcgtagagg ggcggggtgg gggtaggaaa 1260 cgcgacggggagggcggcgg gcgttggaga gagggcgggg gcggggattg ggaggtgtag 1320 attttttaaatttatttcgg ggaggtgggt ttgtgtgatt tgcggtgggg aggggtaaga 1380 ggggttgatttatttttttt tttttttgtt ttttttttat taggtatttt agatagtaaa 1440 tttttttgtcgtttttttgg ttagggaagg agagtttttt taggttagga ttttttaggg 1500 tggttggatttgaaggggtt gtagtaaggg ttgtggattt gggtaattgg tttgcggggt 1560 tgtgaggggtgggcggatgg ggatggagtg tggggattat ttatttgtta ggtggttggt 1620 tttagtgtgttaggatgagg cgattaaggt taattacggc gcgggaagtt ttaatggggg 1680 ataggggttgtaatttatat ttttagtata tatggtggag taggcgtttt tatttacgtt 1740 tagtttacgtttttttagaa tttttaaata tttttatgtt tgggtaggtt atataattag 1800 aggttattaagtaattttta tggatttttt gagattgggg gtgggggaat tatttgattt 1860 ttagtttggatttcgttttt atgtttttaa atggtggttg ggtggtgtgg gggatattta 1920 taggaatgaaagggttatgc ggagtttgtt tttatgtatt taggtattat aggtggatga 1980 gtattagtgagtatttgttg tgttgtagac gttgtttggg gatttgggga tattttgagg 2040 aattagttaaatttggtttt tggttttttt ttttattggt tggtgtaggg attgagtata 2100 ttagtttttggataacggta agataataaa tgtggaaagt ttttttgaga ggtattgggt 2160 gatttttaggggatttggtt aggaatattt tttggaggag aggaaatgtt tttttttttt 2220 tattagttaagtggaaggga agagtatttt aggtagaggg gcggtatgag tgtggttcga 2280 gggtttggagttgtggggtt ttgagattgt ggttattgtt ttcggagtgt tgagacgttg 2340 ttggtggttgagtttaggag ttgagatttt gttgttgatt tttgtatttt taggtaagtt 2400 atttaaatttttgtgtttta attttttttt ttatagaatg agaatagtga tagtatttat 2460 tttgtggggttgatggtata tagtgtgatt aaagtatata gtgtaatagt ggtatataaa 2520 gttttttaagtgagtggtgg ttaaaaatat tgtgatattg taataaaaag ggtttgtggg 2580 ttgtttttagagggtggtag gggttggcgt agttgaggaa agggaaggtg gtagggggtt 2640 gttgaggtttggggttggtg gtatagaagt ttttgttttt ttatagtaag atttagtttt 2700 tggattttttgggttttagg gtcgggtttt tgagggtttt gtttttagga ttagtaggag 2760 gatatttttggggatacgta gatttgagaa ttttagggtt agttgttttg agggattcgg 2820 ttgggttggtttttttttta ggtttttttt ttagggttag gttgaattga gttttttgga 2880 tttttgaagttaataattgt tttatttaat tttgattttt gagggtatga gaatcgaggt 2940 ttttggaggttggtttttat tacgttttta ttgtagtttt tgtttattat cgagtttttt 3000 ttttttggggttgggtttag tttttttaaa gtttttttga tttagtatat tgggaaagag 3060 ggaagagttagtggagggtt ggggagtgac gttaaggttg tttttatttt gttttgattt 3120 tttttttaagggttttggag gtttgaataa ttcggttttt tttttagagg atgaagaagt 3180 tgggattaattaagataata gttattataa tttggttatt ttatttggaa atgtttttgg 3240 aattatatgtttttttgtat tttttttgtt ttggttttgt ttaggttgtt gttattttag 3300 tggttttttagttggttttt tgatttttag ttttattttt ttaatttagt ttttatattt 3360 ttttagaaatttgattaata tcgttttgtt gaaaagttat ttatggtttt ttattatttt 3420 ttgggtaagttttaggtttt ttaattttta gtttttggtt atttttttag ttttattttt 3480 tatttttttcgttgtgattt aattaggttt tattgatggg gttttttgtg cgtttttgtt 3540 tttgtttttgttgttttttt tgtatggagt atttttacgt gttgaacgtt gtgaattagg 3600 attttttttagttgttgttt ttttttagaa gtttttttgt tggttttttt tgtgttaggt 3660 gtatttttgtgtttttagta gtttagttat tatttatggt gttttgtttt tgttatttaa 3720 aaatttttaattatgttaaa aagtagttat tataaaatgt attattttaa ggattttaag 3780 tgtatagtttagtagtgttg agtatattta cgttgttttg taatagattt ttagaatttt 3840 gttattttgtaaaattgaaa ttttgttttt agtaaattat tttttttttt ttattttttg 3900 gtgtatggtttatttatttt tatttttttt ttttattaga ttgtgagttt tttgagggta 3960 ggtagttgggtttttatatt tttattattt agtagggtat tagatttgta tataaatttg 4020 ttaatttaataagtatttag tttggtgtaa aagtaattgt ggtttttgtt attaaaagta 4080 atagttattaagtatttttt atgtgttgtg atgttatttt agatagtgga gataattagg 4140 gaataataataaaaaaattt ttgttttcgg aggttttata ttttagtaaa atgtagaata 4200 tgttagacggtgatgaatgt tttgggggaa atgaagtagg gaggagtgag agtgtagggg 4260 tggtaagttttagttttttt tgtttttttt tttttttgag atggagtttt gttttgttgt 4320 ttaggttggagtgtagtggt gcgattttaa tttattgtaa tttttatttt ttaggtttaa 4380 gcgatttttttgttttagtt ttttaagtag ttgggattat aggcgtatgt tattacgttt 4440 agttaatttttgtattttta gtagagacgg ggttttattg tgttggttag gatggtttcg 4500 attttttgattttatgattt attcgtttcg gttttttaaa gtgttgggat tataagcgtg 4560 agttattgtggtcggtttta atttttagta ggagaggaga gaacgtttta ttaagtagtt 4620 gatatttgatgtaagttttg aaggtaggga ggaagtttcg tggttatttg ggggtatagt 4680 attttagatagagggaattt aggatgtaaa ggttttgggg aaggagtgtg tttggtgttt 4740 tttggtttgggggatagtag gagattagtg tggttgtagt aggtgaggaa agcgaagtga 4800 gtttagaaaggtaataggcg agatgcggat ggggtagatt ttgcgggttt ttgaaggttt 4860 gtgtaagatgtttttggagg tttgggatag aggagtgata tggtttgatt taggttttga 4920 taggattattttagttgttg tgttgggaat agattatagg ggtgggtgat agatagatat 4980 ttttttttaatgtaggattt gttgtgtagc ggtgtggaga ttggttagtt gattgttttt 5040 atttattagtatttttaggt gtgtttttgt tgtttaagtg gttatgtttt ttttggggtg 5100 gttttaggttatgattgaat tagggggtgg ttaaggtttc gttattgttg ttcggtgtag 5160 agttgttcgtatggatagtt tttgtttttg agttttttgg gatatatttt gttgtttaat 5220 tttgttttttttttttttat atttatagga gttatttttt aatgtattta tttagttttt 5280 ttttagagtttattttttag agttaggggt aggaagcgag aagatggaag tagttatttc 5340 ggggagagatttgttagttt gggttgttgt aagattgagt agtttaaata ataaatattt 5400 attttttatagttggggagt atagaagttc gagatttagg tgttagtatg gttaagtttt 5460 tggtgagggttatttttttt ttgtattttt atatggagga gagagagaga gattatttcg 5520 tttttatttttttttataag ggtattaatt ttatttagga gggttttatt ttatgattta 5580 atgatttttgaaggttttat tttttaatat tattatattg gggggtagag ttttagtata 5640 tgaattttgggaagatataa atatttagtt tatatgggga tttggattag ggtgaatgaa 5700 tataaaggaatgttttgttt attttgggtt gtagggtggt tgtgatttta tatagtagat 5760 gtggatttgaagattatatg aaattttaat tttatatgta tgattggagg gagtttgtag 5820 tgaatttttatgggtgggga aggcggaggt agaggaacgt attttgagaa cgttaagggg 5880 acgtgagggttattttgtgg tgatttaatg tgttttggtt tttggtggtg aatagtagtt 5940 atttaatatatattggatga gattagtgaa ttgtattgtt tagaatagtt ttaggttaaa 6000 ggtaggttgtgtagggttgg aatgtttttt tttttatggt tttggtttat agtttggaga 6060 aaaggggttaggattagaag tttagttttt gttgagcgtt aattttttgt aggaatagtt 6120 agtgatgttttttggttatt ttgattttta agttattttt ggttaggtag ttagaat 6177 19 6219 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 19gatttattat ggaggagata aaatgattta aattatgaaa aaagattggt ggggtgattg 60ttataaaatt gttaaaatag tttataatta atgtttggtt tgttaaattt ataattgtgg 120taagataata aaaattttag gtgatatatt ttttgaatat ttataaatgg tttttattta 180atttttattt taaatgtatg ttttttggtt gtatagaaga tttttaatgt aggaaggtta 240atgatataat aatagttaaa aggttattgg aaaatatgtt ttttttatgg ggtattgtcg 300gagaaatttt tagtaataga gaggtatgta ttttattgga tacgttgtaa aatagttaaa 360taggtattat aaatataata gtttaggaaa agttaattga attgattgga ttgttttggt 420taaaggtatt attgattgat ggtaataaga tttattttta ttgtaaaata taaattgatt 480ttttataaaa tagttattgg aaggtttatg tttttaataa taaagtttta tgtatttttt 540ttttttataa attttgatat gatttaatag tgtaagtttt gaatgtattt tgttaaagta 600tatttttatt aagtgaaaga agttttttat gatttattaa ttgatgataa ttaagtgttt 660tataatatag aatttggagg tgggggtttt ttggaaataa ttttagagaa agatattatt 720tgaattcggt tgaaagggat tatattaagt ttttttttgt agtaaatttt aaggttttga 780attttggatt tgtatttttt aatataaaag aggttttgta gatttttgga attataaatt 840tgttggagat tttgaaataa agttgattag ggaagttttt ttttagaagt atatggtatt 900ttatatgtag atagtttttt taatattgta gattaagagt tttttgttat tatgaaagtt 960tttttttttt tttttttttt ttttattttt tgtaatatta attttttttt tttttttagg 1020aaaattttaa ataatgttag atttttttga attatatatg taaggatatg ttattaatat 1080gtattttaga atttgtaaga aattaataga aatttaatag ttttggtata aggttattaa 1140tcgtaatttt agttgttatt ttaaaatgtt gtatgtaata gaaataattg aatttttttg 1200ttaatttggg atgatatttt gtggatggtt ttggtaaagt tttatggttt ttaagaaatt 1260agagtaattg ttgggtttat gagttaatgc gtaaaaattt ggaaataatt ttattaacgt 1320taatgtttgt gtttttaatg agagttattt tgtaatttta aggaaagaga ggaaggttat 1380ttttgatatg ttatatatta ttgttatttg tttttttata tttgttgaaa atagtatttt 1440gattttttta gttaataatt aaattgttat taaatataaa aaatttggat agaggggatt 1500ggttaatggg tgtaaagtta tagttagata ggaagaataa aagttgttat tttattatat 1560agtagaatga ttatagttaa taataatgta ttgtatattt taagatagtt agaagagatg 1620attttgaatg ttatttttaa aaagaaatga taaatgttta aagtgatata ttatttaata 1680attattttga tttgattatt gtttaatata tatatgtatt gagatattat attgtatttt 1740ataaatatgt ataattatta tttgttaatt gtatataaaa gtaaaaaaaa aaaattatta 1800gaatgatgtt tgtaaaaggt attttgtgtt ttcgggtatt gtatatttaa gacgttgggg 1860attatttatg tgggtataaa taattgtttg tgtgatttta ttggattaaa tttagtaaag 1920tttttttatt agatttagtg gtttgtattt ttataatatg ttatataggg attatagaag 1980agtaagttta ttattggatt ttatttagga gttatgttaa tttgtgggtg gataaattta 2040attgatttcg gtttaaatat tattaagtgg tttttttttt aagtttttaa gggtttatat 2100tgggttggtg gataatttga tttgtttttt ttgttgtttt tttattggtt tagattttgt 2160tatttggttt ggttcgtttt tatattttaa tagttttttt tgaaagtttt tataatattt 2220tttataatta gaggttaaag tagttaataa ttaaagtaag tattaattta aaaataaatg 2280aagataagtt agtttttatt gaggaaaggt tttaatggag gtgttggaat ttatttttgg 2340tattagtagg gtgtttgttg tatggaattt gaaattaatt tataaattgg ggaaaatttt 2400gaatttgtag ttagttagat tttttagggg tttatatggt agaagttatt taaatatttt 2460tagtggatta aaatatttgt gtttaataaa tatattttat ggaatattat ataattttgg 2520attttttttt tgtttatgtt gggggttttt gtatggtgtt gaataaaatt gaatgttgta 2580tttatttttt ttttaatttt attattatag aaaatttaat ttaaaaggtg gtagatattg 2640ttgttttttt aaatattgtt attgaatata ttaaggaaat tttttagggg aaaggaatat 2700atgatatatt tatgggagta gttaatggtt ggtttgtagg tattttgagt agtgaaaggt 2760aagttaggtt attttaaatt tttttaattt ttatgttttt ttagtggttt tttaggttat 2820tataatttgt gttattaggt taattataaa aatggatatt tttttaaatt aggttataag 2880gttgaattag gttatttagt gaattatggt ttttgtaaaa agtaaagtag aggttttttt 2940ttaaagattt ttttttttat ttgattagga ataaatagta atttttttta gaagtaaaat 3000ttatttaaag atttgttaat atttttaaat atttgttagt tgtaataaag aaattaatgt 3060attttatgtt tttagttttt ataatttagt ttaaatattt gttttggtat gtttatattg 3120gtttaagtgg gtattaggtt atagtttgtt tttttttttt atttagaggt gttttttttt 3180ttttagtatt ttataagtta tttttttttt tttttgtttt tttttgtttt tgtttttttt 3240aagaattttt aagttgttag ttaattaaga taaatataga atgtgaagtt tcgttttagt 3300taatggaaat tagttataat agtaaggtgg acgggttagg ttataaatga ttttgttttt 3360tttgttcggt gtatttttgt gggaaaattg ttggcgagtg tatttttttc gtagaaagta 3420aaaatggttt tgttaaagaa attaatttta tgtttaagtg ttattttttt acggtattaa 3480gaaataagta tttttagtag tttttaatcg ttataatgtt ttaaattaga ttatgattaa 3540ttggatttaa atattttgaa ttatttttat tgtttgaatt ttgaattgtt taattttgat 3600tagtttagtt tgtggagatt tttgttaagg tgtgtatttt agtttattgt tatatttttt 3660ttcgtggtta taatagtttt tttgatgtgt tgttgttttt tcgagagttt ttaatgtttt 3720tatgtagtta ttttttgtat attaaatggt gttattatag ttagaataat aatatgaaga 3780aagtataatt atttaattaa tttgatattg tgatttttat attgagataa aataaggttt 3840tggttaattt cgtaaaattg agaggttgat ttaaaggagg aaattgttat taaattaaat 3900ttggtttaaa gttgtttttt tatttagtaa agtataatta aatttaatat gtaaataaat 3960tgtaatgtaa tttgagagta cgttttttta ataagtggtt aagttttggt taattatcgt 4020agcggagttt ttagtttatt ataggttgta aaaaatattg tttataaacg cggtttgttt 4080attgttaggg gttggagttt tttgaatttt tattggttta ggatattata tgatttatgt 4140tttttttgtt tagataaatt ttgttaaatt tgtttgaagt ttttttgtta ataatattta 4200aatataaagt aaataaatta ataagaattt tatattatta agttatagta attagaaagt 4260atttatttga gtgagaagat tggttaagtt gttatttagt tttttattat ttgataagat 4320attttttttt tatgtttttt aatagtattc gttattttag aaaggttgtt ttatgatttt 4380aaatcgttta tatgtttatt gtattgatag acgtttaacg ttaagatggg taattaaagg 4440ttaatttttt ttttattttt tttgagtttg atttttgtat tgtaatttat ggttattaga 4500tatttgtttt gggtgttcgt agtttatatt tatttttttt ttaggggaaa taattattgt 4560ttacgggatt aaaataattt cgagttgatt atttggtgat attaattaac ggtgtatatt 4620ttgggtttat tattaatata gttaagtagt atatattttt ttagagttta gatatgtata 4680tgttattaaa ggatagtatt ttatagagtt aatattattt attttataga ataaggggtt 4740agtggttttt tagaagaagg gtttgttttc ggttttatat tagaacgtta gtcgttaggt 4800ttcgttgttt agtaggtttt aagttcgcgt ttattcgggt ttcggttgtt gatagttgcg 4860agttcgcgcg tgtatattcg tttaacgttg ggacgttata gttagggtta atgggtagag 4920cgggattcga ggtttcgttt tcgttttgtg gcgttacggg gacgtcgggg gcgcgcgggt 4980tgtagggtcg cgtaggtttt cgtttttaga gtttggtttt tcgcggttgt tcgtttcgcg 5040cgtttttttt gttcgggttt tttcgttgtc gtcgtcgttg ttatattatg gttttcgtta 5100ttaggtagtt tatgcgtttc gtgttttttt cgtttatcgt ttcggtttcg gttaagaaga 5160taatcgttaa gtacgtgacg gttatcggcg gcgggttgat gggcgtcggt attgtttagg 5220tgagcggttt tttttgtacg gtgtttacgc gtttggttcg ttattttgag gtggaagttt 5280tggcgcgatc ggtcgcgagg ggttgtattc gttcgatatt agggagtttt tatttcgcgt 5340ttttcgggtg tagttgaaat atttcgcgtt tgggtttgtg agggtttaag ttttattttt 5400tttaaaattt agggttttgg gtcgattttt agttttttcg tttggaaaat tttggttgtt 5460tttagggttc gttgaaggtt ttatggagag tggcggtgaa tgtattttgg aagcgggtcg 5520tgtaagagaa gaaagaattg tatgtgtata aggtttaggt ataacgcgtt tgtttttgtt 5580cggtttaaac gggagtttgt tgttaaagat atgaattgcg attagtttta attttattag 5640ttatttttga tttttatttt gtaattgtgt agtttttgtt aaagtagttt ttttttttaa 5700acggtttttc ggtttttttc ggtttttttt tcgtttgtta ggttgtaaag aatagtagta 5760gttatgattt ttgtagtatt ttgtaaagtt atttaatgga agattgttga ggttttggtt 5820ttgatttttg aaatagtgtc gtttgtgtag agttttgagt ttgcgatttt ggcgttgtag 5880cggaataagt tttttttttt tttttttttt tttttttttg gagtcggagt ttttttgatt 5940taggttggag tggagtgtaa tggcgcgatt tcggtttatt gtaattttcg tttttcgggt 6000ttaagcgatt tttttgtttt agtttttcga gtagttggga ttataggcgt ttcgttcggt 6060taattttata tttttagtag agatagggtt ttattttgtg ggttaggttg atttcgaatt 6120tttgattaaa ggtgattcgt tcgtttggtt tttcgaagtg ttgggattat aggcgttagt 6180tattgtattt agtcggaata agttttttat ttattgtat 6219 20 6219 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 20 gtataatggataaaagattt gtttcggttg ggtgtagtgg ttaacgtttg taattttagt 60 atttcgggaggttaggcggg cggattattt ttggttagga gttcgagatt agtttgattt 120 ataaggtgaaattttgtttt tattaaaaat ataaaattag tcgggcgggg cgtttgtaat 180 tttagttattcgggaggttg aggtaggaga atcgtttgaa ttcgggaggc ggaggttgta 240 gtgaatcgagatcgcgttat tgtattttat tttagtttgg gttaaagaga tttcgatttt 300 aaaaaaaaaaaaaaaaaaaa aagagagaga tttatttcgt tgtagcgtta aaatcgtaag 360 tttagaattttgtatagacg gtattatttt aaaggttaaa attaggattt tagtaatttt 420 ttattaggtgattttataaa gtgttataaa agttatgatt attattattt tttataattt 480 agtaagcggagggaagatcg gggagagtcg ggaggtcgtt taggagagga aattattttg 540 ataaaggttgtataattata gaataaaaat taaaaataat tgatagaatt aaaattgatc 600 gtagtttatgtttttggtag taaattttcg tttgagtcga gtaggaataa acgcgttatg 660 tttgaattttgtgtatatat aatttttttt ttttttgtac ggttcgtttt taaaatgtat 720 ttatcgttattttttatgga atttttagcg ggttttgggg gtagttagaa ttttttaaac 780 gaggaagttgaggatcggtt tagaattttg aattttgagg ggagtgagat ttgggttttt 840 ataggtttagacgcgagata ttttaattat attcgggagg cgcggggtga aaattttttg 900 gtgtcgggcgggtgtagttt ttcgcggtcg gtcgcgttag agtttttatt ttagggtggc 960 gggttaagcgcgtgggtatc gtgtagggag ggtcgtttat ttgggtaatg tcggcgttta 1020 ttagttcgtcgtcgatgatc gttacgtgtt tgacgattat ttttttggtc gaggtcgagg 1080 cggtggacgaggaggatacg gaacgtatga attgtttggt gacgaaggtt atggtgtggt 1140 agcggcggcgatagcgagga gattcgggta gggaagacgc gcgaggcggg tagtcgcgga 1200 aagttagattttgggggcgg ggatttacgc ggttttgtag ttcgcgcgtt ttcggcgttt 1260 tcgtgacgttataaggcggg ggcggggttt cgagtttcgt tttgtttatt ggttttggtt 1320 gtaacgttttagcgttgagc gggtatatac gcgcgggttc gtagttgtta gtagtcggag 1380 ttcgagtgagcgcgggtttg agatttgttg agtagcggga tttggcggtt ggcgttttgg 1440 tgtggggtcgagaatagatt ttttttttga aaagttattg gttttttgtt ttatgaagtg 1500 agtggtgttgattttgtaaa atgttatttt ttgatgatat gtgtatattt aggttttgaa 1560 gaaatatgtgttgtttggtt gtgttggtaa tggatttaaa atgtgtatcg ttggttgatg 1620 ttattaaataattaattcgg gattatttta atttcgtgga tagtgattgt tttttttaaa 1680 agggaaataaatgtagattg cgaatattta aaataaatgt ttagtgatta tgagttataa 1740 tgtaaaaattaggtttaggg aaggtaaaga gagagttgat ttttagttat ttattttgac 1800 gttggacgtttattagtgta gtgaatatgt ggacggttta aggttataga gtaatttttt 1860 tggaataacgaatattatta gaaagtatag gaaagaaatg ttttgttaaa taatggaaga 1920 ttggatagtagtttggttaa tttttttatt taggtgaata ttttttaatt attgtaattt 1980 agtgatataggatttttatt aatttatttg ttttatgttt aaatattgtt aataaaaaaa 2040 ttttaaataagtttagtaga gtttatttga gtaaagaaag tatgaattat gtagtatttt 2100 gagttagtaaaggtttagag agttttagtt tttaatagtg ggtaagtcgc gtttatagat 2160 aatattttttgtagtttgta atgggttaaa agtttcgttg cggtgattgg ttaagatttg 2220 gttatttgttaggagaacgt atttttaaat tatattgtag tttatttata tattaggttt 2280 gattatgttttgttaggtag ggaggtaatt ttaggttaga tttaatttaa taatagtttt 2340 tttttttgggttagtttttt agttttacga gattgattag aattttgttt tgttttagta 2400 tggaagttataatgttaaat tagttgagtg attatatttt ttttatgttg ttattttaat 2460 tgtaataatattatttggtg tataaaggat ggttgtatag agatattgaa gattttcgag 2520 gggataataatatattaggg agattattat ggttacgaga aggagtatag taataaattg 2580 aggtatatattttaatagga gtttttataa attgaattga ttaaaattaa ataatttaaa 2640 gtttaggtaataaagatagt ttaaagtatt tgagtttaat tggttatggt ttaatttagg 2700 gtattatggcggttaaggat tgttagaaat gtttattttt tggtgtcgta aagaaatagt 2760 atttgaatataaaattaatt tttttagtaa ggttattttt attttttgcg gaaagagtat 2820 attcgttagtagttttttta taagagtata tcgaataaag gaggtagggt tatttataat 2880 ttgattcgtttattttattg ttgtgattgg tttttattgg ttagaacggg attttatatt 2940 ttgtatttgttttgattggt tagtaattta gaaattttta aaagaggtaa aggtagagga 3000 gaataaaggaaggaggaagt aatttgtgga atgttgagaa gggaaaaata tttttaaata 3060 aggaagaggaataggttatg atttaatgtt tatttggatt agtataagta tgttagggta 3120 aatatttaggttaaattgtg ggagttaaga atataaagta tattgatttt tttattatag 3180 ttagtagatatttaagaatg ttaataggtt tttgaataaa ttttgttttt aagagaggtt 3240 attatttatttttaattaga tgaggaggaa agtttttgaa aaggaatttt tattttattt 3300 tttataaggattatagttta ttgaatgatt tgatttagtt ttatggtttg atttaaagag 3360 gtatttatttttgtaattag tttggtaata taagttataa taatttggag agttattaaa 3420 gaagtataaagattagaaaa gtttggaata gtttagtttg ttttttatta tttaggatgt 3480 ttataaattaattattagtt gtttttataa atgtattatg tgtttttttt ttttgagaag 3540 tttttttaatatatttagtg gtagtgttta gagaaatagt agtatttgtt attttttaaa 3600 ttaagttttttatagtagta aaattagagg aaaaataagt gtaatattta gttttattta 3660 gtattatgtaagagttttta gtatgagtaa agaggagatt taaagttgtg taatgtttta 3720 tgaagtgtgtttgttgaata taaatgtttt gatttattga gaatatttga gtagttttta 3780 ttatgtgaatttttaggagg tttgattggt tataaattta agattttttt taatttatag 3840 attagttttaaattttatat aataggtatt ttgttaatgt taagagtgag ttttagtatt 3900 tttattggaattttttttta gtagaaatta atttgttttt atttattttt aggttggtgt 3960 ttattttggttattgattgt tttaattttt gattatgaaa ggtattatgg gaatttttag 4020 ggaaggttattgggatgtag gagcgagtta ggttaaatag taagatttga attagtgagg 4080 aaataatagagaaggtaggt tagattattt attaatttaa tgtaggtttt tgggggtttg 4140 aaaagagggttatttagtgg tgtttgagtc gaggttagtt aaatttgttt atttataagt 4200 tggtatagtttttgaataaa atttagtggt gaatttattt ttttgtggtt tttatatagt 4260 atgttgtaagggtgtaaatt attggattta gtaaaaagat tttgttagat ttaatttagt 4320 gaaattatataagtaattat ttgtatttat ataggtagtt tttaacgttt taagtatgta 4380 atgttcggaagtataagata ttttttgtag gtattatttt gatagttttt tttttttatt 4440 tttatgtataattgataaat aataattgta tatatttatg gggtatagtg tgatgtttta 4500 atgtatgtatatgttgaata atgattaaat taggataatt attaaataat atgttatttt 4560 aagtatttattatttttttt tggggataat atttaaaatt atttttttta gttattttga 4620 aatatataatatattattat tagttgtagt tattttattg tgtaatagaa tagtagtttt 4680 tattttttttgtttaattgt aattttgtat ttattgatta atttttttta tttagatttt 4740 ttatatttggtaatagtttg gttattaatt ggaaagatta agatattatt tttagtaagt 4800 ataggaaggtaggtagtagt gatgtgtagt atattaaaga taattttttt tttttttttt 4860 ggggttgtagggtgattttt attaggaata taggtattag cgttaatgaa attgttttta 4920 gatttttgcgtattagttta taaatttaat agttattttg gttttttgga gattataaga 4980 ttttgttaaagttatttata gagtattatt ttaaattgat aaggaaattt agttattttt 5040 gttgtatataatattttgag ataataatta gaattacgat taatagtttt atattaggat 5100 tattagatttttattaattt tttataagtt ttgaaatata tattaataat atatttttat 5160 atatataatttaaaaaagtt tggtattatt tagggttttt ttaaagaaag ggaaggaatt 5220 agtattgtaggaaatagaga aaaaaggaaa aaaagagaag gtttttatga tagtaaagaa 5280 tttttgatttgtaatattag gaaagttgtt tatatatagg atgttatatg tttttaggga 5340 aaaatttttttgattagttt tattttaagg tttttaataa gtttatagtt ttagaagttt 5400 ataggattttttttgtgttg agaaatgtag atttaagatt taaggttttg aagtttgttg 5460 tagagaagaatttggtatgg ttttttttaa tcgagtttaa gtaatgtttt tttttggagt 5520 tatttttaaaagatttttat ttttaggttt tatattatga aatatttggt tgttattagt 5580 tggtgggttatgaaggattt tttttatttg gtaaaaatat gttttggtag aatgtattta 5640 aggtttgtattattaagtta tgttagggtt tataagaggg gaagatatat gagattttat 5700 tattaggggtataagttttt tagtaattat tttatgaggg gttaatttat gttttatagt 5760 gggaatggattttattgtta ttaattagta atatttttga ttaaggtaat ttaattaatt 5820 tagttagttttttttaagtt attgtgttta taatatttgt ttaattgttt tatagcgtgt 5880 ttagtgaaatgtatattttt ttgttgttag aaattttttc ggtaatgttt tataagggaa 5940 atatattttttaataatttt ttagttattg ttatattatt ggtttttttg tattggaaat 6000 tttttatataattagaaaat atgtatttaa agtggaaatt gaatgaaagt tatttgtagg 6060 tgtttaggaaatgtattatt tgaagttttt attgttttat tataattatg ggtttgataa 6120 attagatattggttataaat tattttagta attttataat agttatttta ttaatttttt 6180 tttataatttgaattatttt atttttttta taatgagtt 6219 21 8131 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 21 aaattgattt gaagttgtaatgaaaaattg ggggaggtgg ttgttgatta ggaaaggatt 60 ttgggatagg ataaataggtatatttaaga tttttttaat ttttgatttt gtttaaagtt 120 attttttttt ttaatatgaaaacgaggtat gtgttagatt ggggagttag tagatagttg 180 ggatggaaga tagtataaatattaaggttt tgtttttgtt taggtttttt tgtatataat 240 tttttgagtt agaagaaggtaagatggtag ttttattgtt tttttttttt atagataatg 300 ttttgttgtt ggatggtattgatttagtgg ttagtagtat ataagaaata gttgttattt 360 tttgagtaat tattacggtttaggtaatgt atgtggtttt tatttaattt ttatagtaat 420 tttatggggt ataggtattattattttaat ttttagatga ggaagtaaag gtttagagta 480 ataaataagt tattttttgtttatggtagt ggaattatag tgtttttatt ttttattttt 540 gaagaaaatg ttatattttgattttagtat tgattatttt tttgtttttt ttttagtgaa 600 aagtagttta ttagttatgttttataagtt taattttcgt ttgttttttt ttttattaaa 660 tggtaattta ttggaggtagcgttgtataa ataggggata gtgtgtgtat ttgtttgttt 720 gaagataaga aaagggaaagggtatttttg gaaagtgaat tatttagttt aaaattgagt 780 agttttttta aaatatgagttagtagtagg agggtatgga ttagttagat taggaattat 840 aggtttaatt attagttaatggggagttaa gggaagaata gttatttatt ttttttatcg 900 tttttttata atcgttttgtttgtttatag ttttattttt tttatgttgt gattttgtga 960 gaggagtatt agtgaaagagtgaagagata aagtataaaa tgtgtgagat tagtttatat 1020 ttgtattttg tttttgataaaagttaattt ttttgagatt tggttttttt gtttataaaa 1080 tgggaaaaaa ttatattaatagggttttaa ggattattat aatgtggata aagttttgat 1140 ttagtataat gttattatatagaagaatga gttagtggta gtagttatta atgtgatgtt 1200 agtttatgtg ttataaatgatgttgtattg aggggtggag ggatggggga cgggtgtaga 1260 tgtaagagga gatagtttttagaggaatgt gtatttagga gggattattc gggttttatt 1320 aattattagg tttttataggaaatttgggt tttaggtatt tagagttttt ttagggtttt 1380 tggatttttt ttatttttgaaagatgagaa atagttgttt tgttgatgtt gttaatttac 1440 ggagagttgg gaagttttataaattttata agttattgtc gtaaattgga agagatagag 1500 ggggattttt ttttgttaggcgttgtagtt gtgttttttt atttagtttt tatagtagtt 1560 ttagtagagg ttgtgtttcgtttatttttt ttaggtattc gttattttgt tgtatattta 1620 tagagttttg ttgtaagtatttgagatttt gtttgaggat tttttttggt ttgtgttggt 1680 ataagttgag agtattagggagttagtgtt tttgggatag tttttagtta gtggaagtgg 1740 gaggatagat attttagtttttttatttag tgagggataa ttttaaggta tattttattt 1800 attttttagg gttttttgtgggagtgaatt tttttaagtt tttagtaata attaacgtat 1860 atttttttgg tttttttttttttttatttg gtttttagtt ttttttttgt atttttttga 1920 ttaggattgg gattagggtgatgagttttt atttttgggt ttatttaagt gtaaggttgg 1980 tattcgtatg aatttgagagggttttttta tattttgtat tttaggtata ttatttgtat 2040 tgttttgatt ttggttttgttttggattat tttttaaata aagttatttg tatttaaatt 2100 aggtttgttt ttgggtttatttaatttaaa gtaaatttta tgaagatatt agtttttaag 2160 ttttatataa ggaaaatcgaggtttagagg aataagaaat ttgtttaagg ttttttagtt 2220 ggtaatgaga tgggattttgaaattaggtt tgtttgattt tagagttgaa gttttttgta 2280 ttatagtata ttattttttattttttattt tagttataaa attaatgatt taagggaaat 2340 tttaggtttg gatgagtttatttttgtttg tgaattaggg tagttattgg ttttaaggtt 2400 gttagtagat gggaatttggggaggggaag gtaggtagta agtggatgag agggttgtag 2460 ttgttagtgg aaagatggattagtggaaag attgttgaaa ttatatgtat taggaagata 2520 gtaagagttt gtttgtttttttttagtttt aaaagttttg gatttttttt ttttttgaga 2580 tagttttgtt ttgttatttaggttggagta tagtggcgtg atttcggttt attgtaattt 2640 attttgtttt ttaggttcgagtaatttttt tgttttagtt tttcgagtag ttgggattat 2700 aggtgtatat tattacgttcggttaatttt tttaattttt agtagagacg gggttttatt 2760 gtattggtta ggttgattatgaatttttga ttttaagtga ttcgtttatt tcggtttttt 2820 aaagtgttgg gattataggcgtgagttatt atgtttggtt agtcgtggat tattgagatt 2880 gtgggagggt tttttaatttaataaaaatt aattgatatt tgttttttgt tagataaaga 2940 attgaggttt gaggttgtacgggtgaataa gaaatatttt ttgggagttt atagtataat 3000 ggggaagaag aatatataaatagatgtttt taataaatag atataaatgt agtgatataa 3060 gaatatgtat tataatacggaattaataag tagattatat ttagttgggg tcggttagga 3120 ggagtttttt agagaagggttttttattgt cgttgatgat tataatttaa gggatgagga 3180 aaaatgaggt gaaaaggtgggagaggttaa agggagggtt attttagata agttagtgta 3240 aataaagata taatagaagtagttcgatgt gtgtaggaga gttgtaaggt atatttacgg 3300 tataaagggt gtggaataaattgggggagt ttattgagga tttttgtgtt tggtatgggt 3360 attgtgagtg gtgagaagtttgtgagtaag cgtagaggga aggtttgatt ttttagttta 3420 tcggtagtgt tttggttgtgtttatttttt ttttagtaaa ttgttttttt ttatttttta 3480 gttttatttt tatagttggagattggtatt aaggggttat gagggaattt cgtgaggatt 3540 tgtttttttt tttgttggttagtggttatt tggtgtttga agagaatcgt tggtagttgt 3600 agtgtttttg ttatagttaggttgttttag ttgtttatag attttaagtt tagttatttt 3660 ttttttttta ttggttttgatttagatttt ttttggtatt ttgattaggg aattaggatt 3720 tttgtttttg ggggtttggatatagatttt ttagaaacgt agatgaagag ttttggttat 3780 gtttgttagg ggtatatttttattttggtt taagaaatgg taggttattt gtatgaatta 3840 tagttgggtt ttttatagttagttttatat tttttttttt taattgaata aagttgaaag 3900 ggattgggat tttaggttaggtaggatgtt gtgttgtttg tgatagttat tttatttttt 3960 gttattttat tttttatttttttgtttttt atagtttata tgtttggttg gtatttagta 4020 aattttatag taggattgatgtttggtatg ttttttggtt tttttatgtt attattgata 4080 gaggagttat tatttttggtttttattttg atgttatgtg gaggtttatt atttgtggat 4140 agagttattg ttgataaggtagtttgaagt tttaaagtgt atttatgttt ttaataaaga 4200 ttgttgtagg ttgtttagtattttatattg gtgttttaag gttttgtgtt tttgaggaga 4260 aatttttata gaaaaatagtttgttcgtta atagttttat agtagtttaa tatttttttt 4320 tttttagtag agaagatttaagatgtgaat ttattttttt tgcgtagttt atagattaaa 4380 ggttagattt cgtagtttgtttgttatttt tttttttatt atatattttt attttggtgt 4440 atttttttta ggcgtttggagttgtatttt attgttgtgt gtgtgtgatt tgtggttgtg 4500 tatatgtttt ttattttgttaaggattatt tttgttagta tattgttgtt ttttttttaa 4560 gatttagttt ttttagttagttttgtttat tttttgtaga gttagttttt ttcgtttgtg 4620 tttttatatt gttttttgtttaaaagtatt tattataatt tttttaggtt aggcgttttt 4680 agtttttttt aggggcgagttattatttta gaatttatta tatttgtaaa ataaatagtt 4740 tttagtattg tagagggaatggtttaaaat tttagattta gtttaacgtt ttatttcgcg 4800 gtaattattt tgtttaagtttttattatag ttttgtttag tttgggttat ttttagggta 4860 ggtttggaag gaagtgtagttttttgaatt agttgatgtt tggtaagtgg tggtggagga 4920 aaagggtggg gtttgaggatattataattc gggttatttt tgagtgttgt ttttggttat 4980 tggggtgttt tatattgttagataagagtt tagatttgag gagagtgatt agtttttttg 5040 tgttttaggt aagtatttcggtttaaatta cgtgttgttt tttttatagt tgttttgttt 5100 tttatttttt cgtttggttaatattaggtg aagtggatat cggaaagatt aagttagtgg 5160 tttttttttt tgtttgagatggggtttttt tttttattat ttagattgga gtatagggta 5220 tagttaggtt tattttagttttgatttttt gggtttaagt gattttttta ttttagtttt 5280 cggagtagtt gagattataggcgtatatta ttatatttag ttaatttttg ttattttttt 5340 ttagcgatgg cgttttgttatgttgtttag gttagtttta tatttttggg tttaagtagt 5400 ttgtttgttt tagttttttaaagtgttggg attataggtg taagttatta tatttagttt 5460 gttagttggt tttcgatggtagtttttaat attagtagag gtttttgggg tattttttag 5520 gaggaaaatt tatttcgtgtagtttattta gttaagggaa gttacggggt ttttaggtaa 5580 atagattttg ggttttggggatattgtagt gaaggagata tgtttttttt tatagggaat 5640 tttagtggga agagatagagttgaatatat ttatttagta tataaatatt agggttattt 5700 ggggattgtt ttatagattttgttatgtaa aaatgttgaa taaatattga atggatgagg 5760 gaatgaatga gtgagtgaatgaataaatga attagttggg ttttgagaaa gatacgtgtg 5820 tagtttttag tttttttcgaaggtaattgt tttagttatt ttattttatt tttgaaatag 5880 atttgtagta tagaataagaattttatatt tttatttgat agatttggaa atttagtata 5940 ggtatgtatg gtttggggagatttattaga agttgatttg ttgttttatt aaataaaaaa 6000 ttatttattt tttttgtttttaattttgga aaggtatatt agtatatatt tatattagat 6060 tttgtgtcgg ttatgagtgtagaggtgatt aagttgggtg gggtaaggag gtgaagaaat 6120 tagaagtaga gttgttagtttaggaggttg ttgtaataat taggtcggag gatggtttgg 6180 tgtagtgtgt gggaatggggaggaggggat gtagaggaga gtttttagag agtttgagat 6240 ttaattgtat agaggaggtgagggtgaggg atgcgcgtag gtagttcgaa cggtcgtgtg 6300 agtgagtata tttcgatgtttttagttaag gtggagaata gaagagtttt gtgggggtaa 6360 ggtgatggaa aaatgagtatggtttgttga atttgaggag tttttttatt atttagatag 6420 tgatgtttaa tagattattgggatttagga ttaggttgag gttaaacggt agaatttggg 6480 agttttgata tagttattaatgaaattttg ggaatgggcg agataaaggg agtgtagagg 6540 gagggtatga acgaaatttgggaattttat tgtttgaacg gaacgagaaa ttatttgatg 6600 atagattata gagagatttaggaaggagat ttaggagtag attgtcgtga aagttatagg 6660 atagggggaa ttttgtattaagagaatgat tattggggtt ttgtatgttt gagagagggt 6720 agtagagttg gggattgaggaaaaggtttg ggatttggtt gttagggagg ttatcgtgta 6780 ttacgtggag gttaaatttagtgagtatag tgggagtagg taaggagggg agtgtagggt 6840 tgggaaggta ttatatttttagaagttttg ttgttgtaag gaagggaggt aaagtgattt 6900 agtggataga tgtttttttttatattgggt tttttgttgt gttttttttt ttttttattt 6960 ttaaagagta tttgatttattgagggtttt tttgggatta tggaaatagt aatattattt 7020 ttagttcgga tgagcgaagtatttgatatt tttatagttt tttatagtgt gtaaggattt 7080 taattttttt aatttttatagaattgagtt ttttatgtta tagaggaaat ggagaattat 7140 agagttttag tttagatttaattatataaa tttgaatgta tatttgagta agtttttttg 7200 ttttcgtgat tttattgttttatataattt tttgatatat gttggtttta ttttatagat 7260 gaaaagtttg gaggttgagatggggtgtag ttgttttgtg gagagtaggg tttttatttt 7320 tgagtatagg gttttttttgttttgtatta ttttattgtt aaaatttatt tgatgtttat 7380 gttgtatatt atattttataaagtattttt ttaggtgtta ttttatttag tgtttataat 7440 aattttgtga gggtagatattatttttttt tgttttatgg atggaagttg aaatttaaag 7500 aagttataaa tgacgtttaaggttaggtta ttagtggaat ttttttttga agtatagatt 7560 tatttttgtt tatgatttttgttgttttta ggatgaaatt tatgtgtttt agtttggtat 7620 aatggttgtt ttttttttagtttgtttgtt tttttggtag gtttttggtt ttttttttgt 7680 tttaagtttt tagtatgtttttgatttttt aattatagta gtatgtttat ttattatatg 7740 tggttatttt gtttattgtttgtgttaatt atattgtgat tgttgatgag attgtgaggt 7800 ttttgagggt agggtttaggtttgttttat ttgtattata acgtttagta tagtaggtat 7860 taggaattgg tgaatgttaatgaatgatag aattaacgaa tggtatttgg attgaaatta 7920 gtttttttag tgtttttttattagatatgt ttgtgaaaaa taagggtttt ttggttgatt 7980 gttataggat ttttgatggttggaggtttt gaattttgtt tttagttttt tttttggttt 8040 tttttaaaag gaaggaagttggtttgggtt atagattttt agggtttata gagtaaatgg 8100 ttgatttagg ttgtttttttttttttatag g 8131 22 8131 DNA Artificial Sequence chemically treatedgenomic DNA (Homo sapiens) 22 tttatgggag aaaagggata atttgggttaattatttatt ttataggttt taggagtttg 60 taatttagat taattttttt ttttttgaaggggattagga aggaagttgg gagtagaatt 120 tagaattttt aattattaaa gattttgtagtagttaatta gaaggttttt gttttttata 180 agtatgttta atgagagagt attggaaaggttgattttag tttaaatgtt attcgttaat 240 tttgttattt attgatattt attagtttttgatgtttgtt atgttggacg ttgtggtata 300 gatgaagtag atttaggttt tgtttttagggattttatag ttttattaat aattatagta 360 tgattagtat aggtagtgag taagatggttatatgtaata gatggatatg ttgttgtggt 420 tgggaggtta gggatatgtt agaggtttggaataaagagg gaattaaaga tttgttagag 480 aagtaggtag gttggaaaag ggatagttattgtgttaggt taaggtatat gaattttatt 540 ttgaaggtaa taggggttat ggataggggtggatttgtgt tttagaaagg ggttttatta 600 gtgatttgat tttggacgtt atttatgatttttttgaatt ttagttttta tttataaaat 660 aggaggaaat aatatttatt tttataaggttgttgtgagt attaaataga ataatatttg 720 gggaaatgtt ttatgagatg tagtgtgtaatataaatatt aggtgggttt taatagtgaa 780 gtgatgtaga gtagaaagag ttttgtatttagaggtggga attttgtttt ttataaggta 840 gttgtatttt attttaattt ttaggttttttatttgtgaa atgggattaa tatgtattaa 900 agggttgtgt ggggtaatga gattacgagagtaaaggaat ttgtttagat gtgtatttag 960 atttatgtag ttgaatttga attgaaattttatgattttt tatttttttt ataatatgaa 1020 aagtttagtt ttgtgaggat taaaggagttagggtttttg tatattgtaa ggaattgtag 1080 aaatgttaga tatttcgttt attcgagttggaggtggtat tgttgttttt atagttttaa 1140 gggagttttt agtgagttag gtgttttttaggggtggggg aaaagggaaa tatagtagag 1200 ggtttaatat gggaagagat atttgtttattgagttattt tatttttttt ttttgtaata 1260 gtagaatttt tggaaatata gtatttttttaattttatat tttttttttt gtttattttt 1320 attatgttta ttaaatttgg tttttacgtggtatacggtg atttttttaa tagttaaatt 1380 ttaagttttt tttttagttt ttaattttgttgtttttttt taggtatgta aagttttagt 1440 agttattttt ttgatataga attttttttgttttgtggtt tttacggtag tttgttttta 1500 ggtttttttt ttgagttttt ttgtagtttgttattaagta atttttcgtt tcgtttagat 1560 aatggggttt ttaagtttcg tttatgttttttttttatat tttttttatt tcgtttattt 1620 ttaaggtttt attaatagtt gtgttagggtttttaaattt tatcgtttgg ttttagttta 1680 attttaaatt ttagtggttt gttagatattattatttgga tggtggagaa gttttttaaa 1740 tttaataagt tatatttatt tttttattattttattttta taaagttttt ttgtttttta 1800 ttttgattgg agatatcgaa gtgtgtttatttatacggtc gttcgggttg tttgcgcgta 1860 ttttttattt ttattttttt tatgtaattggattttaggt tttttaagag tttttttttg 1920 tatttttttt tttttatttt tatatattgtattagattat ttttcggttt gattattata 1980 atagtttttt aaattgatag ttttgtttttagttttttta tttttttatt ttatttaatt 2040 tgattatttt tgtatttatg gtcggtatagggtttggtat aggtatgtgt taatgtgttt 2100 ttttaaaatt ggaagtaagg ggagtgggtagttttttatt taataaagta ataaattagt 2160 ttttgataaa tttttttaaa ttatatatatttatgttgag tttttaaatt tgttaaatag 2220 gggtgtggaa tttttgtttt atgttgtaggtttattttaa ggataaaatg aggtaattgg 2280 ggtaattatt ttcgaaaagg attaagggttatatacgtgt tttttttaag gtttagttag 2340 tttatttatt tatttattta tttatttatttttttattta tttaatattt atttagtatt 2400 tttatatgat agaatttgtg aagtaatttttaagtagttt taatatttat atgttaggta 2460 aatgtattta gttttgtttt tttttattgagattttttgt ggggagggat atgttttttt 2520 tattgtagta tttttagagt ttagggtttgtttgtttaag ggtttcgtgg ttttttttag 2580 ttgaatgggt tatacgaagt gagttttttttttgaaaagt attttaggga tttttattga 2640 tgttgggagt tgttatcgag aattagttggtaggttgggt gtggtggttt gtatttgtaa 2700 ttttagtatt ttgggaggtt gaggtagatagattgtttga gtttaggaat gtgagattag 2760 tttgggtaat atggtaaaac gttatcgttagaaaaaaata ataaaaatta gttgggtgtg 2820 gtggtgtgcg tttgtagttt tagttatttcggaggttgag gtgggaggat tatttgaatt 2880 taggaggtta aggttggagt gagtttgattgtgttttgta ttttagtttg ggtgatagag 2940 agagagattt tattttaaat aagaaagagaattattggtt taattttttc ggtgtttatt 3000 ttatttggtg ttgattaaac ggagggatgaggaataagat agttgtggaa ggaatagtac 3060 gtaatttaga tcgaagtgtt tatttgggatatagagaagt tagttatttt ttttaggttt 3120 gagtttttgt ttggtaatat gaggtattttaatgattaaa agtaatattt aggggtgatt 3180 cgagttataa tatttttaag ttttattttttttttttatt attatttatt aaatattagt 3240 taatttagga agttgtattt ttttttaagtttgttttaag agtagtttag gttaggtaag 3300 gttgtggtga aaatttgagt aagatgattatcgcgaagtg gagcgttgaa ttgggtttaa 3360 gattttgggt tatttttttt ataatgttgagggttgttta ttttgtaaat atagtgagtt 3420 ttgaggtggt ggttcgtttt tagaaggagttggaggcgtt tagtttggaa aggttatggt 3480 aagtattttt gagtaagagg taatgtgggagtataagcgg aagggattga ttttgtagag 3540 agtgggtagg gttagttgaa gaagttgagttttgaagaaa gaatagtagt atgttgataa 3600 aagtggtttt tgataaagtg gagagtatgtgtataattat aaattatata tatatagtaa 3660 tgaggtgtag ttttaggcgt ttgaagagggtatattaagg taggaatata tagtgggaga 3720 ggaggtgata ggtagattgc ggagtttagtttttagtttg taggttgcgt agggagagta 3780 ggtttatatt ttaggttttt tttattggaagaaggggagt gttaggttgt tgtggagtta 3840 ttggcgaata agttgttttt ttgtgggaatttttttttaa aggtatagaa ttttggggta 3900 ttaatgtaga atattagata gtttgtaataatttttgttg aaggtatgga tatattttaa 3960 agttttaggt tgttttgtta gtagtaattttatttataga tagtaggttt ttatatgata 4020 ttaggatgga gattagagat agtggtttttttattagtag tggtatgaag aggttaggaa 4080 atatgttaaa tattagtttt gttgtgaagtttattgggta ttaattaggt atataggttg 4140 tgaaaggtag ggaagtgggg gatggggtggtagagggtag agtggttgtt ataaataata 4200 tagtattttg tttagtttgg gattttagttttttttaatt ttgtttagtt gggagaggag 4260 aatgtggaat tgattatgaa aggtttagttgtgatttatg tagatagttt gttatttttt 4320 gagttagggt gaggatatgt ttttgataagtatggttagg gttttttatt tgcgtttttg 4380 gaaggtttgt gtttagattt ttaggagtaggggttttggt tttttagtta gaatgttagg 4440 gaaagtttgg gttaaggtta atggagggagaaggatggtt gagtttgagg tttgtgagta 4500 gttgggatag tttggttgta gtagaggtattgtagttgtt agcggttttt tttagatatt 4560 agatggttat tgattaataa agggaaggataagtttttac gaggtttttt tatagttttt 4620 tagtgttaat ttttaattgt agagatggagttaaggaatg aggaaaggta gtttgttggg 4680 ggagaggtgg gtataattag agtattgtcgatgggttggg aggttaggtt ttttttttgc 4740 gtttgtttat aggtttttta ttatttatagtgtttatgtt aggtatagag atttttaata 4800 agttttttta atttgtttta tattttttatatcgtgaatg tgttttgtag tttttttata 4860 tatatcgagt tatttttgtt gtgtttttgtttgtattgat ttgtttggaa tgattttttt 4920 tttggttttt tttatttttt tattttatttttttttattt tttaaattat aattattaac 4980 gataatgagg agtttttttt tgaaaagttttttttggtcg attttagttg agtgtggttt 5040 gtttattggt ttcgtattat gatgtatgtttttgtattat tgtatttata tttgtttatt 5100 aaaggtattt gtttatgtgt tttttttttttattgtatta tgggttttta gagaatgttt 5160 tttatttatt cgtgtagttt tagattttagttttttattt ggtaaggaat aagtattaat 5220 taatttttgt taaattgaag agtttttttataattttaat agtttacggt tggttaagta 5280 tgatggttta cgtttgtaat tttaatattttgggaagtcg aggtggacgg attatttgag 5340 gttaggaatt tatgattagt ttggttaatatagtgaaatt tcgtttttat taaaaattaa 5400 aaaaattagt cgggcgtggt ggtgtgtatttgtaatttta gttattcggg aggttgaggt 5460 aagagaattg ttcgaatttg ggaggtagggtaagttgtag tgagtcgaga ttacgttatt 5520 gtattttagt ttgggtgata gagtaagattgttttaaaaa aaaaaaaagt ttagggtttt 5580 tgaaattgag aggaagtaag taagtttttattgttttttt ggtgtatatg gttttagtag 5640 tttttttatt agtttatttt tttattgataattataattt ttttatttat ttattatttg 5700 tttttttttt tttaaatttt tatttgttaataattttaag gttaatagtt attttgattt 5760 ataggtaaaa atgagtttat ttaaatttgaaatttttttt gagttattag ttttgtgatt 5820 gaaatgagaa gtaggaagta gtgtgttatagtatagaaag ttttagtttt ggggttaggt 5880 agatttggtt ttaaaatttt attttattattaattgaaag attttagata aattttttat 5940 ttttttgagt ttcggttttt tttgtataaaatttggagat tgatgttttt ataggatttg 6000 ttttaggtta ggtaaattta gaggtagatttaatttgaat gtaaataatt ttatttggga 6060 agtgatttag gatagggtta gaattagggtaatgtaaatg atatgtttag ggtatagaat 6120 gtaaagagat ttttttaggt ttatacgggtgttaattttg tatttagatg aatttaagaa 6180 taaaggttta ttattttagt tttagttttgattaggaaaa tatagaagag gagttggaag 6240 ttaggtagga agagaaagaa gttaaggaagtgtacgttaa ttgttattgg gagtttagag 6300 aggtttattt ttatagggaa ttttgagaaataggtagaat gtgttttaga gttgtttttt 6360 attgagtgag gaagttgggg tatttatttttttattttta ttggttgaga gttgttttag 6420 gggtattaat tttttggtat ttttagtttgtgttaatata aattaagaga agtttttagg 6480 tagagtttta ggtatttgta ataggattttgtgggtatat agtagaatgg cgaatgtttg 6540 ggggaaatgg gcgaggtata atttttgttggggttgttgt aaggattaaa tgaaaaagta 6600 taattatagc gtttaataaa gagaagtttttttttatttt ttttaattta cggtaatagt 6660 ttgtgaagtt tatggagttt tttagtttttcgtgagttgg tagtattagt agaatagtta 6720 ttttttattt tttagaagta aaagaaatttaggggtttta ggagaatttt agatgtttgg 6780 gatttaagtt ttttgtggaa gtttgatggttgatggagtt cgagtagttt tttttgagta 6840 tatatttttt tgaaaattat ttttttttgtatttgtattc gttttttatt tttttatttt 6900 ttagtgtaat attatttgtg atatatagattagtattata ttaataattg ttgttattaa 6960 tttatttttt tatgtgatga tattgtgttggattaaagtt ttatttatat tatggtaatt 7020 tttagaattt tgttagtatg atttttttttattttatgga taagaaagtt aggttttaga 7080 gaggttaatt tttattagaa gtagggtgtagatgtaggtt gattttatat attttatatt 7140 ttgttttttt atttttttat taatgttttttttataggat tatagtatgg ggagaataag 7200 attgtgggta aataagacgg ttgtgaggaggcgatggggg aagtgggtag ttgttttttt 7260 tttgattttt tattagttaa taattaagtttgtggttttt ggtttggttg atttatattt 7320 ttttgttgtt gatttatgtt ttagggaaattgtttaattt taagttaaat aatttatttt 7380 ttagaagtat tttttttttt tttttatttttaggtaaata gatatatata ttgttttttg 7440 tttatatagc gttattttta ataaattgttatttaatgaa agagaaaata agcgagagtt 7500 aagtttatgg gatataattg ataaattattttttattaga agaaaaatag gaaaataatt 7560 aatattggag ttaaaatata gtattttttttaggaatgaa gagtaggggt attgtggttt 7620 tattgttatg gataaaaagt ggtttatttgttattttaag tttttgtttt tttatttgga 7680 aattgagatg ataatattta tattttatagggttgttatg aggattaaat gaaggttata 7740 tatattgttt ggatcgtagt agttgtttaaaaaataatag ttatttttta tgtgttgtta 7800 gttattaggt tagtgttatt taatagtaagatattattta tggaaggaaa agatagtgag 7860 attgttattt tgtttttttt taatttaaaaggttgtgtgt aaagggattt aggtaggaat 7920 aaggttttaa tgtttgtgtt gttttttattttagttattt gttaattttt tagtttaata 7980 tatatttcgt ttttatgtta aaagaaaagataattttgga taaaattaga agttaggaga 8040 gttttgagtg tgtttgttta ttttgttttaagattttttt ttggttaata gttatttttt 8100 ttagtttttt attataattt taaattagtt t8131 23 8168 DNA Artificial Sequence chemically treated genomic DNA(Homo sapiens) 23 gagtttggtg gttttgtttt tagtttggtt tgtgtgtttt ttttttgtagtgcgtggatt 60 cgtttatttc gcgttagtac gtatagggag ttttatttag taagtatatttattatattt 120 ttaaagacgg tgttataggt tatgaatttg ttgtataggt tatagatgtttagaatttgt 180 ttgtcggagt tttgtgaatt tttgttggta aattttgatt tgtataggaaagaaaaagta 240 ttagatgttt ggatattttt gttttatttt ttttattttt ttttttatgataattttggt 300 gtatatttta tttagtataa attatttttt tggttttttt tattttataatatgtagcgt 360 tgtgtcggta gttgtatata gagaatatat aaatttgatt ttattttttaggattttata 420 attaatttaa gtaatagatt agaaaattaa gtatattaat atatttatttatttagaaaa 480 taataattta atatatggta tatgtaaaat attgtgtttg gaattgaatgaaagtaaaat 540 aaattagtat ttaataggga gtatttttat tatgtagaag attttatttattttttaaaa 600 aaataaaatt aaaataaaat agaaaatttg tattttacgt tttttagtattttttaattt 660 ttttattgtt gaattttttg tttttttgtt taatttattt tgataaaagagttaaaaaat 720 aaaataaggt cgggcgtagt ggtttacgtt tgtaatttta gtattttgggaggacgaggt 780 aggtagatta cgaggttagg agatcgagat tattttggtt aatacggtgaaatttcgttt 840 ttaataaaaa tataaaaaat tagtcgggta tgggggcggg tatttgtagttttagttgtt 900 cgggaggttg aggtaggaga atggcgtgaa ttcgggaggc ggagtttgtagtgagtcgag 960 atcgcgttat tgtattttag tttgggtaat agagcgagat tttattttaaataaaataga 1020 ataaaaaaag taggtttaaa ttttttggag tattttagta tgttagggttatgtagtaaa 1080 tatttgtagt aaaaatattt attttttagt taaaaaaagt attgtaattaattttagtta 1140 taagtgttat tggttgggtg tagtggttta tatttgtaat tttagtattttgggaggtcg 1200 aggcgggtag attatttgag gttaggagtt tgatattagt ttggttaatatggtgaaatt 1260 tcgtttttat tgaaaatata aaaagtagtt aggcgtggtg gtatatgtttgtaattttag 1320 ttatttagga ggttgaggta ggagtattat tggaatttag gaggcgaggttgtagtgagt 1380 cgagattacg ttattgtatt tttgggtgat agagcgagat tttattttaaaaaaaaaaaa 1440 tagaaatgtt atttatataa tatcggagta ggagtaggag attggtagtatttaggtatt 1500 aggattttaa aattaggcgg attttgggga ataagtttag ttttttttttgttttttttt 1560 attgagtttt tatttgggag aaatttttcg gttacgggag ataatgataaggtagttttt 1620 aaattagtgg gtaatgagtt tatggttttt aaaggcgaag tagggtttacgtttattagg 1680 ttggtataag tagatatatt tattttcggt tataatgaat tgtaggttttgagaagggtt 1740 atttagggtt gagtagcgta ggttataatt atgggtgttt aattttacgcgagggtagtt 1800 ttttttagaa attatatagg attgttagaa gtaataaagg ggttaataggtttttttgag 1860 gaggtaattt taagttttta taaaggtatt tttattttta tattggtttttttttttttt 1920 ttggtatttt aaagtttttt ttttggttgt tggttttttt tattaattattatttattta 1980 ttaaatatat aattagagat tataattttt ttttttgtat atattattattatttagtat 2040 agaaattttg taagtaagaa aaatgtaata atttattatt ttattaagagtatttttgag 2100 agagtagatt gttgtaaatt tggggtatta ggaataagaa aggtaaagatatttgtttaa 2160 cgttatttaa aaagttagtt agaaaatagg tcggtgtagt ggtttatgtttgtaatttta 2220 gtattttggg tggttgaggt aggtggattg tttgggttta ggagttcgagattagtttgg 2280 gtaatatggt gaaattttta tatttagaaa aaatataaaa attagttaggtatggtgata 2340 tatgtttgta attttacgta tttaggaggt tgaggtggga ggattatttgagtttaggag 2400 gtagaggttg tagtgagttg agatagtatt attgtatttt agtttgggttatatagtaag 2460 attttgtttt aaagaaaaaa aaaaaaaaaa gttagttaga aataaaatttaagggttagg 2520 tgcggtggtt tacgtttgta attttagtat tttggaaggt taaggtgggtggattatttg 2580 aggttaggag ttggagatta gattggttaa tatggtgaat ttttgtttttattaaaaata 2640 taaaaattag ttgtatatgt tggtgtgtgt ttgtaatttt agttatttaggaggttagag 2700 gtaggaaatt tgtttgattc gggggagatt ggggtaatag tgagttaagatttcgttatt 2760 gtatttaagt ttgagtaata tagtgaaaaa aatggttttg ttgggtgggggtttgaataa 2820 gtaaaatttt taaaattttt taagaatggg ggtaagataa aattaaaaaaaaagtttatt 2880 ttttattttt tttttttttt ggttttaggt ttggggaatt aaaaaaaataatggtattaa 2940 ttttttaatc gttcggaaaa ttttaatttt gttaaaaatt aaaattaaattaatttaaat 3000 aaaataaggt ttaaattatt aatggttggg ggtttattcg gaggttaaaaaatttttttt 3060 ttttttttat ggaggtttgt gatgggagtg gaaagtatga agaagtttgagtttaagttt 3120 ttggaatttt agttagattt agagggtatt ttgggtgttt ttttttttttggagtgatgt 3180 taatagatgg tttttgacgt attaaagggt atgaaatttt attattaaagtatttgtttt 3240 aagattttta ttttattttt tttttttttt ttatttaaag atagggttttattttgttat 3300 ttgggttgta gtgtagtggt ataaatatag tttattgtag tttgaatttttgggtttaag 3360 ggattttttt tttttagttt tttgagtagt tgggatgata ggtgtatgttattatgttta 3420 gataattttt aatttttttt ttttttggaa aaaaagttta attttggtggtcggggtttg 3480 agtgaaaggg ggcgatttcg gttaattgaa attttcgttt tttaggttaaagcgattgtt 3540 tttttttatt tttcggagta gttgggatta agggtatgta taattatttttagttaattt 3600 tgttttttaa gtaaaaaggg ggttttttta ttttggttag ggtgtttttgaatttttaat 3660 ttaaggttta attttaaaat ttttaaaaat gtaaaaatgg ggtttaataatttttgttta 3720 gggtggtttt aaaattttgg ggttaaataa tttttttttt tttggtttttaaagtggggg 3780 gaaaataagg gtgaattttt tatttaagtg ggtgattttt aataattattatttttaatt 3840 atttttaata ttataggggc ggggcgtatt tttttaattt taatattttgggaggtcgag 3900 gtgggggaat aattttgagg ttaggaattt aaaatttttt ttaataaaaaggaaaaattt 3960 tatttttatt taaaaaaaaa aaataatcgg gttttgtggg gggtgtttttaattttaatt 4020 aatcgggggg gttaggtaag aaaatttttt gaattcggga ggcggaggttgtagtgaagg 4080 gaaattgggt ttttttaatt ttttttcggg taaaaaaaag gaaaatttttttttaaaaaa 4140 aaaaaaaaat tatgtttatg ggaaagtatt ttttttaata agttttttttttattatatg 4200 tagcgtttgt gtttttattt tagttatttg tttttaggta tgatttttaatttttttgaa 4260 ttagtttttt tattttaaga attgaaatgt tggttgggtt agtggtttacgtttgtaatt 4320 ttagtatttt gggaggttaa ggcgagatga ttgtttgagt ttaggagttcgagattagtt 4380 tgggtaatat agtgaggtta ttttttcgtt gtttttataa aaaaatttagaaattagttt 4440 tacgtggtga tgtgcgtttg tagttttagt tgtttgggag gttgaggtggggggatcgtt 4500 gaagtcggga ggttaaggtt gtagtgattc gtggttatgt cgttgtattttagtttgggg 4560 atatagtgag atttcgtatt aaaaagaaaa atgttgttta ttttaaggttgtagtaaagt 4620 taagtttgaa tagagtaaag gaagcgttat agaagttgta ttatttgtttatgttatagt 4680 tggggaatgg ggtggtcgaa tggggaggtt tattgtcgta atgttttaattttcgtttag 4740 agggagggat ttttttttcg agggagggcg tcggaagtga cgcgaggttttgcggagatt 4800 aggagttaga ttgtaggacg atttcgggtt ttacgtgttt tcggtattcgtcggtcggag 4860 ttttcggttt ttcggggtcg ggggatttta gtggtattta tatatagtttattttttaag 4920 cggagttatg tttggtaacg gtaatgcggt tgtaacggcg gtgagtgttgagtcggtgat 4980 tagtatattt tgggtttttg gacgattcgt gtagcgattg gttttaggttgttattttta 5040 gttgtttatt ggttagaacg gttatttttt tttttttttt ttttttttttttggttcgag 5100 tagtttttaa agggttagta gttcggttgt ttttcggaag gaatggggaaattagagagc 5160 ggtgatattg ggttaagagt ggaaggattg tttggaacgg aatttcggtttttgcgggta 5220 tttgggtggg atttttatta ggtttgggat gtacggtttt agatttagtgatttagatta 5280 agaacgttcg tttatataga cggggttttt ttattcgagg ttgggttgaggcggatgtag 5340 atacggtttt tttgggaaga tacgttttat ttttgattta taggagagagtattagttaa 5400 gttttcgaat tgtatataaa cgttttagaa gtgcgttttt tttttgtgttatagtggttt 5460 tttagttata gttaacgttt taagttttta gttgtgatat atttattgaattattatcgt 5520 gggtgggagg tcgtcgtggg tttttttatt acgagtttgt ttgtcgagttttgggtttgt 5580 gtatagataa attgtagagt tggtggaggt tattgttagg tcgagataagaaagagatgg 5640 ggagttgtta attttttttt gtttagtttg ttggtgaggg ttgggatttttgtttttgta 5700 gttattttag agttttggat taggagtagg aagatttgaa ttgtggttttaatttttttt 5760 cggttattag ttttgtgatt ttaggtaagt tattttattt tttgatgttattcgttgttt 5820 ttgtaatatg gttttaaagg tgtttgtttt gtttatttga taggatttttgagacgataa 5880 taatatgtaa aagtaatagt tttaatatag aagtgtttag tgttttattttttaatgaaa 5940 cggtttgatt tggatatgtt gtgtatattt aatgaattta aggaattgtttgaatttagt 6000 agttttggga ttttagagtt ttttttgtgg gttttttgtg gtttagaattttggtggtta 6060 cgtttaatat taagtttagt ttaatttgta aagggttttt tagggttaatttattggagt 6120 gattatatgg agtagattag agtttgaggg tagaaagttg ttatttgtttcggtaataga 6180 ggttttagat gtttgggtgt aaaagaattt tatagtattt cgattaatatggtgaaattt 6240 cgtttttatt aaaaatataa aaattaggtc gggtatagtg gtttatgtttgtaattttag 6300 tattttggga ggtcgaggta ggtggattgt ttgagtttag gagttcgagattagtttagg 6360 gaatatagtg aaatttcgtt tttattaaaa atataaaaaa ttagtcgacgtggtggtatg 6420 cgtttgtagt tttagttatt tgggaggtta agataggaga atcgtttgaatttgggaggt 6480 ggaggttgta ttgagtcgag atcgcgttat tgtattttag tttgggtgatagagcgcgat 6540 ttttttttaa aaaaagaaaa aaaaaaaaat tatttttttt tttttatatatatatatata 6600 ttttagttgg gtatggtggt gtgcgtttgt agtagtttta gttatttgggaggttgagtt 6660 aggagaatcg tttgaatttg gaaggtagtg gttgtagtta gttgagaatatgttattgta 6720 ttttagtttg ggtaatagag ggagattttg ttttaaaaaa aaaaaaaaaaggaattatat 6780 aggatgaata ttttagatta gggaatgttg attgtcgata gtattagtatttatagtggt 6840 tattgtttga tgtagagaat gggattaggt taggcgtgtg tttacgtttgtaatttcgag 6900 tattttggga tggttgggtg tagagaggat atattaagtt cgatgattatgtttgtgtta 6960 atatagtaga aatttttgtt tttatataaa aatgtagaaa attagttgtggtatgtgtgg 7020 aatatgtttg atagttttag attagaattt atggggtgga ggtttgtagtgagtttagat 7080 tacgttattg tattttagtt tgagtaaaat agtgagattt tgtttaaaaaaaaaaaaaaa 7140 aaaaaaaaaa atggggattt tcgttttaaa aggaaaaatt tagttttaggtgtttagcgg 7200 ggaatatttt tggtttaggg tattttgggg gggggaaaag gggtgtttttttgagttttt 7260 gattggggtt ttggtttgta aatattttta tgttggtgaa attagaggtagtattttagg 7320 tgtacgaatt ttaggtagcg tagtttttta gttttatgga atatttgaggtagaagaaat 7380 ttgagtttaa tttttttatt ttatagatga ataaatagat tttgatgggatagtgtattt 7440 aaggttattt agttaagagg ttgagtagga ttgtacgtta gattcgtttattttagtttt 7500 taatgtatgt agtttagtta agattaaagg ggatttttaa ttattgttaagttttttttt 7560 attgtgggga tttttatttt tttgattttt tttgtagtta gatatttgggttttttgttg 7620 gagaaggtgg tagtttgttg tttttagatt ttagtttatt ttatgtggtatttggatggt 7680 attgaaattt ttttaagtgt tttgtttgtt gtagataatg aatttattttttagtgattt 7740 agtataggtt ttttagtgtg gttttggttg ttttgttttt gttagttgtaggttttattt 7800 tttttgtggt taggttgatg ggttttattt ttttatttat ttggttgtgtatagtatttt 7860 tattgataat tgttttggtt aaggtgggtt ttagggttta gtgttttggttattgtagcg 7920 gtagtaatag taggttttat tatcgttttt ttttagtttt tgtttttttggatttttgag 7980 gagggtagaa ggtattgagg aaggttaaag ggattagttt tggagtatttttttattttg 8040 agatttagtt ggttataggt taggttttga agtttttttt ttttaagttagtgattttgg 8100 tttttggata aggtgttgag gaatattaga aatagagggg attgtgatttggggattttt 8160 tttgtagg 8168 24 8168 DNA Artificial Sequence chemicallytreated genomic DNA (Homo sapiens) 24 tttgtagaaa aagtttttag gttatagttttttttgtttt tagtgttttt taatattttg 60 tttaagaatt agaattattg gtttggaagaaaggaatttt agaatttggt ttgtggttag 120 ttgagtttta gagtggggaa atattttaaggttggttttt ttaatttttt ttagtatttt 180 ttgttttttt tagggattta gagaagtagagattagaggg aggcgatagt aggatttgtt 240 gttgttgtcg ttgtagtaat taggatattgagttttgaag tttattttga ttaaggtagt 300 tgttagtggg agtgttgtgt atagttaggtgggtaaagag ataaggttta ttagtttggt 360 tataggaagg gtggggtttg tagttggtaggggtagggta gttaggatta tattggggaa 420 tttgtgttga gttattggag gatagatttattatttataa tagataaggt atttgagaaa 480 attttagtgt tatttagatg ttatatggagtagattagag tttaagagta gtaagttgtt 540 atttttttta gtaagaggtt tagatgtttggttataaaag aagttaagag gatgaagatt 600 tttatagtgg ggaaaagttt gatagtaattaagggttttt tttaattttg gttggattgt 660 atgtattaag gattgaggta aacggatttgacgtatagtt ttgtttagtt ttttggttgg 720 gtgattttgg gtatattgtt ttattaggatttgtttgttt atttataaaa tgaaaaggtt 780 ggatttaggt tttttttgtt ttagatgttttataagatta ggaggttgcg ttgtttaaag 840 ttcgtgtatt tagagtgttg tttttggttttattaatatg gaaatattta taggttagag 900 ttttagttaa ggatttaaga ggatattttttttttttttt ttaaagtatt ttggattaaa 960 agtatttttc gttaaatatt tagaattgaatttttttttt taaaacgggg gtttttattt 1020 tttttttttt tttttttttt tttagatagagttttattgt tttgtttagg ttggagtgta 1080 gtggcgtgat ttaggtttat tataaatttttattttatgg gttttaattt ggaattatta 1140 ggtatgtttt atatatgtta tagttaattttttatatttt tatgtagaga taggggtttt 1200 tattgtgttg gtataggtat ggttatcgaatttagtgtat tttttttgta tttagttatt 1260 ttaaagtgtt cgggattata ggcgtgagtatacgtttagt ttgattttat tttttatatt 1320 agatagtagt tattgtagat attgatattgtcgatagtta atattttttg atttgggatg 1380 tttattttat gtagtttttt ttttttttttttttgagata gagttttttt ttgttgttta 1440 ggttggagtg tagtggtatg tttttagttaattataatta ttgtttttta ggtttaagcg 1500 atttttttga tttagttttt taagtagttgggattattat agacgtatat tattatgttt 1560 agttaaaata tgtgtgtgtg tgtaaaaaaaaaaaaataat tttttttttt tttttttttt 1620 gagggggagt cgcgttttgt tatttaggttggagtgtaat ggcgcggttt cggtttagtg 1680 taatttttat tttttaggtt taagcgatttttttgtttta gttttttaag tagttgggat 1740 tataggcgta tgttattacg tcggttaattttttgtattt ttagtagaaa cggggtttta 1800 ttgtgttttt taggttggtt tcgaatttttgagtttaggt aatttatttg tttcggtttt 1860 ttaaagtgtt aggattatag gtatgagttattgtgttcgg tttaattttt atatttttag 1920 tagagacggg gttttattat gttggtcggggtgttatgga gtttttttgt atttagatat 1980 ttggggtttt tattgtcgaa gtaggtgatagttttttgtt tttagatttt ggtttatttt 2040 atgtgattat tttaataaat taattttgggagattttttg taaattaggt taggtttgat 2100 attaaacgtg gttattaaaa ttttgggttatagggagttt atagaaagga ttttaaggtt 2160 ttagaattat taggtttaaa taattttttaagtttattga atgtgtatag tatatttaag 2220 ttaaatcgtt ttattaaaaa ataaaatattgagtattttt atgttgaagt tattgttttt 2280 gtatattgtt gtcgttttaa aaattttattaggtggataa gataggtatt tttgggatta 2340 tgttatagaa gtaacgggtg gtattaagggatgaggtgat ttgtttaggg ttatagagtt 2400 aataatcgaa agagagttgg ggttataatttagatttttt tatttttagt ttagggtttt 2460 ggaatgattg taagagtaaa gattttagtttttattaata ggttggatag ggggagatta 2520 gtagtttttt attttttttt tatttcggtttggtagtggt ttttattagt tttgtagttt 2580 gtttgtgtat aagtttaggg ttcggtaagtaggttcgtaa tggaaaggtt tacggcggtt 2640 ttttatttac ggtagtaatt tagtaggtgtgttatagttg gggatttgga gcgttggttg 2700 tggttgggag attattataa tataaaaagaaggcgtattt ttaagacgtt tgtgtgtagt 2760 tcggaggttt ggttgatatt tttttttatgaattaaaagt ggaacgtgtt tttttaaagg 2820 ggtcgtattt gtattcgttt tagtttagtttcgaatgaaa ggatttcgtt tgtgtagacg 2880 aacgtttttg gtttgggtta ttaaatttagagtcgtgtat tttaggtttg atgggaattt 2940 tatttagatg ttcgtaggga tcggagtttcgttttaaata atttttttat ttttaattta 3000 gtattatcgt tttttgattt ttttatttttttcggagggt aatcgagtta ttggtttttt 3060 aaaagttatt cggattaaaa aaaaaaaaaaaaaaaaaaaa aagatagtcg ttttgattaa 3120 taaataattg aggatggtaa tttggggttaatcgttgtac ggatcgttta gaagtttaaa 3180 gtgtgttggt tatcggttta gtatttatcgtcgttgtagt cgtattgtcg ttattaaata 3240 tggtttcgtt tggaaagtag gttgtgtgtgggtgttatta aggtttttcg gtttcgggaa 3300 gtcgggggtt tcggtcggcg agtatcggggatacgtggga ttcgaggtcg ttttatagtt 3360 tgatttttgg ttttcgtaga gtttcgcgttattttcggcg ttttttttcg aaggggaggt 3420 tttttttttt gggcgggaat tggaatattgcgatagtgga tttttttatt cgattatttt 3480 attttttagt tgtgatatga gtaagtagtgtagtttttat ggcgtttttt ttgttttgtt 3540 taaatttagt tttgttataa ttttgaaataggtagtattt ttttttttga tacggggttt 3600 tattgtgttt ttagattaga gtgtagcggtatgattacgg gttattgtag ttttgatttt 3660 tcggttttag cgattttttt attttagttttttaagtagt tgggattata ggcgtatatt 3720 attacgtggg attaattttt agatttttttatagagatag cggggaggtg gttttattat 3780 gttgtttagg ttagtttcga atttttggatttaagtagtt atttcgtttt ggttttttaa 3840 agtgttggga ttataggcgt gagttattggtttagttagt attttaattt ttaaaatgag 3900 gaaattggtt tagagagatt aaaggttatgtttaaagata agtaattgaa gtgggagtat 3960 aaacgttata tgtagtgaga aaagggtttgttaggaaaag tgttttttta tgaatataat 4020 tttttttttt ttttggaaag ggattttttttttttttgtt cgggggggga ttggaagggt 4080 ttaatttttt tttattgtaa ttttcgtttttcgggtttaa gaaatttttt tgtttaattt 4140 tttcgattag ttgggattaa gggtattttttataaaattc ggttattttt tttttttggg 4200 taaaaataag gttttttttt tttattggggggggttttga atttttgatt ttagggttat 4260 ttttttattt cggtttttta aagtgttgggattaaagggg tacgtttcgt ttttgtaata 4320 ttaaaaataa ttaaaaataa taattattaaaaattattta tttgggtggg gggtttattt 4380 ttattttttt tttattttag gaattaagggggggaggatt gtttggtttt aggattttga 4440 aattattttg ggtaaaggtt attaaattttatttttatat ttttaaaaat tttaaaatta 4500 ggttttaggt taagagttta aaaatattttgattaaaatg gaaaaatttt ttttttattt 4560 aaaaaataaa attagttggg ggtggttgtgtatgttttta attttagtta tttcggaggg 4620 tgagggagga taatcgtttt aatttgggaggcggaggttt tagttagtcg aaatcgtttt 4680 tttttattta aatttcggtt attaaaattaaatttttttt ttaaaaaaaa aaaaaattaa 4740 aaattatttg ggtatagtga tatatatttattattttagt tatttaggag gttgagggag 4800 gaggattttt tgagtttagg agtttaagttgtaatgagtt atgtttgtat tattgtatta 4860 tagtttaggt gatagagtga gattttgtttttaaataaaa aagagagaga gagtaaaata 4920 agaattttaa gatagatgtt ttaatggtgggattttatgt tttttgatac gttaaaagtt 4980 atttgttggt attattttag ggagaaggaggtatttagaa tgttttttaa atttaattag 5040 aattttagga gtttgaattt agatttttttatgtttttta tttttattat aaatttttat 5100 aagaaaaaaa aaaaaatttt ttaattttcgggtgagtttt taattattaa taatttggat 5160 tttattttat ttgggttaat ttaattttaatttttggtaa aattagggtt tttcgggcgg 5220 ttggggggtt gatgttatta ttttttttaattttttaagt ttagggttaa ggaaaaaaaa 5280 gggtgggggg tgggtttttt ttttggttttgttttgtttt tatttttaaa aaattttgga 5340 aattttgttt gtttaaattt ttatttaataaaattatttt ttttattgtg ttgtttaggt 5400 ttgagtgtaa tggcgagatt ttgatttattgttattttag tttttttcgg gttaagtaaa 5460 ttttttgttt ttagtttttt gagtagttgggattataggt atatattagt atgtatagtt 5520 aatttttgta tttttagtag agataggggtttattatgtt ggttagtttg gtttttaatt 5580 tttgatttta ggtgatttat ttattttggttttttaaagt gttgagatta taggcgtgag 5640 ttatcgtatt tggtttttga attttatttttaattagttt tttttttttt ttttttttga 5700 gataggattt tgttgtgtaa tttaggttagagtgtaatgg tgttgtttta gtttattgta 5760 atttttgttt tttgggttta agtgatttttttattttagt tttttgagta cgtgggatta 5820 taggtatgtg ttattatgtt tggttaatttttgtattttt tttagatatg ggggttttat 5880 tatgttgttt aggttgattt cgaatttttgggtttaagta atttatttgt tttaattatt 5940 taaagtgttg gaattatagg tatgagttattgtatcggtt tattttttaa ttaatttttt 6000 aaatgacgtt ggataagtat ttttattttttttgtttttg gtgttttaga tttataatag 6060 tttatttttt taggaatatt tttgataaagtagtagatta ttatattttt tttatttgta 6120 gaatttttgt attagatagt gataatatatatagagaaag aaattgtgat ttttggttat 6180 atatttaata gatgggtaat ggttaatgaagaaggttagt agttaagaga aagattttag 6240 aatgttaaga gggaaaaaag agttagtatggagatgggaa tatttttgtg aaggtttaga 6300 gttatttttt taaaggagtt tgttaatttttttgttgttt ttggtagttt tatatagttt 6360 ttggaaaaga ttattttcgc gtggagttggatatttatgg ttgtggtttg cgttgtttag 6420 ttttaagtga ttttttttag gatttgtagtttattgtggt cggggatgag tgtgtttatt 6480 tgtattagtt tgatgaacgt gggttttgtttcgtttttga gggttataag tttattgttt 6540 attggtttag aggttatttt attattgtttttcgtgatcg gaaggttttt tttaagtaag 6600 gatttagtga gaagggatag ggagagggttggatttgttt tttagaattc gtttgatttt 6660 aaaattttaa tgtttggata ttgttaattttttattttta tttcggtgtt atgtaggtaa 6720 tatttttgtt tttttttttt gagatggagtttcgttttgt tatttaggag tgtagtggcg 6780 tgatttcggt ttattgtagt ttcgttttttgggttttagt gatatttttg ttttagtttt 6840 ttgaatagtt gggattatag gtatgtgttattacgtttgg ttattttttg tatttttagt 6900 agagacgagg ttttattatg ttggttaggttggtgttaga tttttgattt taagtgattt 6960 attcgtttcg gttttttaaa gtattgggattataggtgtg agttattgta tttagttagt 7020 gatatttata gttagagttg gttataatgttttttttaat tgaaaaatgg atgtttttat 7080 tgtaggtatt tgttatatag ttttagtatattagaatgtt ttagggaatt tggatttgtt 7140 ttttttgttt tgttttgttt gagatggagtttcgttttat tgtttaggtt ggagtgtagt 7200 ggcgcgattt cggtttattg taagtttcgtttttcgggtt tacgttattt ttttgtttta 7260 gtttttcgag taattgggat tataggtgttcgtttttatg ttcggttaat tttttgtatt 7320 tttattagag acggggtttt atcgtgttagttaggatggt ttcgattttt tgatttcgtg 7380 atttgtttgt ttcgtttttt taaagtgttgggattatagg cgtgagttat tgcgttcggt 7440 tttgttttgt tttttaattt ttttgttaaaataaattggg tagaggaata agggatttag 7500 tagtggagaa attagaaagt gttgggaaacgtaggatgta agttttttgt tttgttttgg 7560 ttttattttt ttaaggggta agtggggttttttgtatgat gaaagtattt tttgttagat 7620 gttggtttgt tttgttttta tttagttttaggtatagtgt tttatatata ttatgtattg 7680 gattattatt ttttaaatga atggatatgttagtgtattt aattttttaa tttgttattt 7740 gggttaattg taggatttta aagggtaagattaggtttat gtgtttttta tgtataatta 7800 tcggtatagc gttgtatgtt atgggatgagagggattaga gaggtgattt gtgttgggtg 7860 aaatgtgtat taaagttatt atgggaaaggaaatagggga gataagatag agatgtttaa 7920 atatttggtg tttttttttt tttatgtaggttagagttta ttagtaggga tttatagagt 7980 ttcgataagt agattttaaa tatttatgatttgtgtaata agtttatagt ttatagtatc 8040 gtttttgagg atgtagtgga tgtgtttgttgagtggggtt ttttgtacgt gttgacgcgg 8100 gatgggcggg tttacgtatt gtaggagaaggatatataga ttaaattgga ggtaaggtta 8160 ttaggttt 8168 25 5690 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 25aattttattg ttttgttatt tattgaggtt tttttttagt attttgtttt ttttattcga 60tatttttttt tttttttatt ttttatattt tgtgttgtaa gtatattatt tgttttttag 120gtagaagcga gtatttattt ttattttttt ttttattttg aaattattta tgatatgata 180ttttagaaat tcgatttttt tgttagtggg agtatatttt ttatatttat taaaaatttt 240aagaatttta tatttggtat gtaatacgat attttttagt tttttgtaaa agatgtttag 300agaaatatgt atgttggtat tttataagtt aatacggata ttttttatat taatagttag 360tgtttgtttt tttttggtaa atggtatggg agttgttgtg tagatattta ttagtaaaat 420tgtagaggtt tttaattttt tatatttggt agaataagtt tatgagttat ttaatttaaa 480gtatttaatt attagtgttt tgaaatttag agggaaaaag atatggaaaa agataataat 540ttttggaggt tttttttgtg tgtgtgtgta tatttatgat gtattagtgt tttatgtttt 600ttttttgatt gaaataaaat aataaaagtt gattatttat aatgaaagtt attttataat 660aattttaaat gttttttatt atattttata atttttttta tataaatgtt agtttttttt 720tttttaaaat attttttaaa tttatagtga aagatattaa ttttgagagt ttattttatg 780atagatagtg tgttaagtgt tttagttttg tatattttag gatataggat gagtttataa 840attgaagtaa aaatttaaaa agggatttta tatgggtgat gtaatattta ggattaattt 900ttatgatatt tagttttatt taaatttaaa ttggttaaaa aatagatgtt gtttgacgtt 960ttatataaaa ttgagaagta ttaaatattt ggaaaataga gttattttag aatttataga 1020ttaatttttt ttgttattga aagtttcgtt gaataaatat tttataagaa ttttaaatat 1080tgattaatga aaaggaagag ttttgtttta taaaattaat gaatataaat tataatatag 1140aaatatttat tttaatgaat ttgaataagt atatgaaata attttttttt tttaaagtga 1200tatatgttgt ttaggtgatt tatggatttt ttgaaatttt tattatttaa ttagttattt 1260ttagatatta tggtttttgt aatggataat tatgttaaag tattttttaa ttattattta 1320gagatatgaa tgatttagtt attattgttg attaaagagt taaaggaaat ataaaattat 1380tgtaaatttt ttaaaattat ttttgaaaaa taggttttgg aaataacgaa gtttttttta 1440attttatcgt taaatttgat aatgatattt tgtttattat tattttagtt ttttaattat 1500gtttttttaa tattatgagt tttgagttat taatttagat tttaagaatt taaaaaatgt 1560gtggaataaa ataagaggtt tatttttcgt tttagaggaa aagttaattt ttgatgaaaa 1620ttaattttta ttttattttt taaaatttga gtatggataa agggtaacgt tagtaagaaa 1680tttatataga aaagaaaagt agtttgatta cgatgatatt ttttatagta tgttagtatt 1740tttttttttt ggaggatatt tgtttttttt ttttttttat taggtaatat ttgtaaaggt 1800taggatgtga gatgtgtgtg agataatgta tgtgtaaata gatttgtttt atattttatg 1860gatgaaatat tttttttaat ttaaaaagta aaaaggtggt attttttaat agtttaattt 1920tttaaaatta gtaaattttt gtttttttga ggtttttttt ttgttttgtt ttgttttata 1980atagtagttt ttatatataa ggtttgtttt tgagttgatt tagaataatt aattatagta 2040gtttattaat ttataagtga tttataagtt attagtttaa gtaaagataa tttgtattta 2100aaagagttgg taatgtttat attaaagtta agattattat aattaaagaa atttgttttt 2160tgtttgtatg gtttaataaa ataagattat tggtttattt ttgggaagtt tggtatattt 2220gattatatta taatatttat tgagtatttt ttttgttttt aggattaaaa aattaataag 2280atagtttttg atttttaaga gtttagatta atgaagagta agattaatcg tttttcgtta 2340tatatttata tttaaattag tttttttatg ttattataga ggttataata aaatttaaaa 2400gttattgttt taaagtttta agtatgaaga attttaattt ttatttaata tttattgatt 2460ttttgatttt taattttaga tgaatatatt agtatattgt tttttttgtt ggttgatatt 2520tttttaagtg tttttagtat tttattttga agtataacgt taataatgta taatttttta 2580tgtttagtta tagaatgttt acgtgtgatt tggttataat atattgtttt atttaggttt 2640ttaataaaat tgattttttt taaatggatt tgtagttgtt gaattttaaa ttaatatttt 2700attttaaaaa tagaaaagga ggggaagggt ggagggaggg gaatagagag ggtataagag 2760gtaaaaaaag aaaaagagga aaataaatgt ttgtaaataa gttaaattaa ataaaagaga 2820tataaagtaa ttttttaaaa gaaggaatga tattttaagt aagaattaaa tatttaggta 2880tgtataaatc gttttcgttt ttttagatcg gttttttttt tttttttata tatttagtat 2940aaattttagg tgagggggta gagaggggtt ggtattgttt gattaaatat attttgtttt 3000ttttttgagt ggtagaattt tagagtttga ttaaatgtta cgaaagggtg ttggtggaag 3060ttaggatgag aagaaatgta atttaataga tttggagaaa tgatgttgta gatattaaga 3120atagagaaag ttggaaattg gtaatatggg gaggatagtt gggttagaaa ggaaaaatag 3180gagaatatag aagaaatgtt atgagaaggg aaaataagag atgttttatt tattattatt 3240tatttcgggg taggtttttt tgtataaggt tatttttagg ttatattata tataaaagag 3300ttatatttga ggtttgtata gtattgttat aattatagtt ttaaaaggtt aaggttttat 3360gatggtaggt ttaaaaaatt ttttttaaaa tatttaataa aataaggggt atttattttt 3420ttttggttta tattatttga aagttaaaag atagttttcg gttttattta ggtttttttt 3480tattttattt tttgttgttt tttatttttt ggtaaatttg gtgaattttt tgttagtgtt 3540gttttttagt aggtttttat taatagtttt gaatgaatat tttattagtt tttatttatt 3600aatagttttg aatgaatatt ttattagttt ttattttgta gtagaatgta tacgtttagg 3660ttttagtaaa agttttttag taaagtttta gatttattta gattatatgt tatttatggg 3720ttaagtattg gttttagagt atatgtgttt aaattggttt tatttagttt atgtgattat 3780ttataaggcg taatatgggt agtttgtttt ttatatagta tttagaaata ttattttgat 3840tgtggtaaat attgtttaat tataattttt tttttaggtt ttttttattt atatttttta 3900ttttatttat agtaaaaatt aaaatgttag ttttagtttt aaggttgtag ttgtttgtta 3960gattttattt taatttattt ttttttttat ttatgtgttt taattatttt tgttttttga 4020atgttttttg aacgtttaag gtagttttta gtttaaggtt ttgttatttt ttgttttttt 4080atttggaata atttttttta cgtatatttt tatgttttat tttttggtat tttttaaatt 4140ttagcgagtg tttttttttt ggtgtgtttt tttttttttt aaattaatta atttaaaatt 4200ggagtttttt ttttgtattt attgggtttt ttttttattt tagttttttt agggtattta 4260ttataattta atagattgta tgttttattt atgtatttaa ttttttatat atgttatttt 4320aatttttatt aaaatataag atttttgaga gtaagtaagt attagaatag taggaaatat 4380attatagtta tttagtgaat tattttttga gttaattaat taatggatga gtgaattaat 4440atagtttttt gagcgggaaa ttttgtataa ggtttagtta aaagggaaat tgagtgggtt 4500aggtattacg gatattatat attttattgt atgatttttt tgtttatatt agaagacgtt 4560tataagttta ttttaaagga tattagttgg aatttttttt ttattaatta ttaagagaat 4620tatgaataag ttgtttatta tttgatttat tatttaattt tgatttttag ttttttatat 4680ttgaaagaag atataatata ttttttatag gattttggga ttattaattg aatttatgtg 4740tgtaaaagga atttatataa tgaaagtatt agaaataatt attatattta taattattgt 4800atttttatat gtttaaaata tagttataat tagtttattt aaatttaagt gtaaaagtaa 4860aatgatttgt tttcgttttg ttttttttgt ttaggggatt atggatattg aagtatattt 4920tgaaagaatt ggttataaga agtttaggaa taaattggat ttggaaatat taattgatat 4980tttttaatat tagattcgag ttgttttttt tgagaatttt aatatttatt gtggggatgt 5040tatggattta ggtttagagg ttatttttga ttaagttgtg agaagaaatc ggggtggatg 5100gtgtttttag gttaattatt ttttgtattg ggttttgatt attattggtt ttgagattac 5160gatgttggga gggtatgttt atagtatttt agttaaaaaa tatagtattg gtatgattta 5220tttttttttg taggtgatta ttgatggtag gaattatatt gtcgatgttg ggtttggacg 5280tttatattag atgtggtagt ttttggagtt aatttttggg aaggattagt tttaggtgtt 5340ttgtgttttt cgtttgacgg aagagaatgg attttggtat ttagattaaa ttagaaggga 5400atagtatatt ttaaatgaag aattttttta ttttgatttt ttagaagata gtaaatatcg 5460aaaaatttat ttttttattt ttaagtttcg aataattgaa gattttgagt ttatgaatat 5520atatttgtag atatttttat tatttgtgtt tattagtaaa ttattttgtt ttttgtagat 5580tttagatggg gtttattgtt tggtgggttt tatttttatt tataggagat ttaattataa 5640ggataatata gatttaatag agtttaagat tttgagtgag gattttgagt 5690 26 5690 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 26atttagagtt tttatttaga gttttgaatt ttattagatt tgtattgttt ttataattga 60attttttatg ggtgagggtg aagtttatta aatagtgaat tttatttggg gtttgtaagg 120aataaaatga tttattagta aatatagatg atggagatgt ttgtaggtat gtatttatag 180atttaaaatt tttaattgtt cgaggtttaa gagtaaagga gtagattttt cggtatttgt 240tgttttttag gagattagaa tgaagaaatt ttttatttgg aatgtattgt ttttttttga 300tttggtttag atattagaat ttattttttt tcgttaaacg gaagatataa ggtatttgag 360gttgattttt tttagaaatt aattttagag gttgttatat ttggtatgag cgtttaaatt 420tagtatcgat aatgtagttt ttgttattaa tggttatttg taggagaagg tgaattatgt 480tagtgttgta ttttttggtt ggagtgttgt aaatatattt ttttaatatc gtggttttaa 540aattaatagt ggttagagtt tagtatagaa gatgattgat ttggagatat tatttatttc 600gatttttttt tataatttga ttaaaaatgg tttttaagtt taagtttatg gtatttttat 660aatggatgtt aaggttttta aagggaatag ttcggatttg gtgttgaaga atgttagtta 720atgtttttaa gtttaatttg tttttagatt ttttatagtt aattttttta agatatgttt 780taatgtttat gattttttaa gtaaggaaaa taaaacgaaa gtaaattatt ttatttttat 840atttggattt gagtaggtta attatggtta tattttaaat atgtaaaaat ataatggtta 900taagtataat aattattttt agtgttttta ttgtatgaat tttttttata tatataagtt 960tagttaatag ttttagaatt ttgtgagaaa tgtattatgt ttttttttaa gtgtgagaag 1020ttggaaatta agattaaatg atgagttaaa tgataaatag tttgtttatg gtttttttgg 1080tgattaataa aagagagatt ttaattggta ttttttaaaa taggtttata aacgtttttt 1140gatgtaggta ggagaattat gtaatagagt gtatagtatt cgtggtattt gatttattta 1200attttttttt tagttgagtt ttatataaag tttttcgttt aaagaattgt attgatttat 1260ttatttattg attgattaat ttaagaaata gtttattgaa tagttataat gtgtttttta 1320ttgttttagt gtttgtttat ttttaaaaat tttatatttt agtgggagtt ggagtgatat 1380atataggaaa ttgaatatat ggataaaata tgtaatttgt tagattgtag taagtgtttt 1440gggaaaatta aagtaaagaa aggatttagt aagtatagag ggagagtttt aattttaaat 1500tagttggttt aaaaaaaaaa aaaatatatt aaaaaaaaaa tattcgttaa gatttgaagg 1560atgttagaga ataaggtata aggatatgcg tgaggaggat tgttttaagt aggaaaatag 1620aaaataataa ggttttaagt tggaaattgt tttgagcgtt taaaaaatat ttaggaagta 1680agggtaattg gagtatatga gtaagaagga gagtggattg agatgagatt tgataggtaa 1740ttgtagtttt ggagttaaga ttggtatttt ggtttttatt gtaagtgaaa tgagaaatgt 1800aaatgagaga ggtttgagag aagggttgta attgagtaat gtttgttata attaaagtga 1860tgtttttgga tattgtgtag agaataggtt gtttatattg cgttttatgg atagttatat 1920ggattaggtg ggattaattt gaatatatat gttttaggat tagtgtttgg tttatggata 1980atatatgatt taagtagatt tgagatttta ttgaggaatt tttgttgaaa tttaagcgtg 2040tatattttgt tataaggtag aagttggtgg ggtatttatt taaagttatt ggtgagtaga 2100agttggtggg gtatttattt aaagttattg gtgagaattt attgaagaat aatattaata 2160aagagtttat taagtttatt aagagatgaa aaataataga aggtagaatg aggaaagatt 2220tgaatgaagt cgaaagttat tttttaattt ttaggtaatg tgaattaaaa aaaaataaat 2280gttttttatt ttgttaaata ttttagaaaa ggttttttaa atttgttatt atagagtttt 2340aattttttga gattatgatt gtaatagtgt tgtatagatt ttaggtataa tttttttgta 2400tgtggtatgg tttgaggatg attttgtata aagggatttg tttcgagatg aatggtgata 2460agtggagtat tttttatttt ttttttttat aatatttttt ttatattttt ttattttttt 2520tttttgattt agttattttt tttatattgt tagtttttaa ttttttttgt ttttggtgtt 2580tataatatta tttttttaaa tttattagat tgtatttttt tttattttaa tttttattag 2640tattttttcg taatatttgg ttaagtttta aagttttatt atttagagag agaataagat 2700gtatttagtt agataatgtt aatttttttt tgttttttta tttagaattt gtattgagta 2760tgtaaagaag agagagaagt cgatttaaaa ggacgaaggc ggtttatata tatttggata 2820tttgattttt gtttagaata ttattttttt ttttaagaaa ttattttata ttttttttat 2880ttggtttaat ttgtttataa gtatttgttt tttttttttt ttttttttgt tttttgtatt 2940ttttttgttt tttttttttt attttttttt tttttttttg tttttaagat aaagtgttga 3000tttggaattt agtaattgta agtttatttg aaagaagtta gttttgttag aggtttggat 3060agagtaatat gttgtaatta aattatacgt gaatattttg tggttgaata taagaaattg 3120tgtattatta acgttgtgtt ttaaggtgga atgttgaaag tatttggaaa gatgttaatt 3180aataggaaag ataatatatt aatgtgttta tttagagttg aaaattagaa aattagtgaa 3240tattaagtag aggttaggat tttttatatt tgaaatttta aagtaatgat ttttaagttt 3300tattgtgatt tttgtgatag tatggaaaag ttgatttggg tgtgagtgtg tggcgggggg 3360cggttaattt tgttttttat taatttgaat ttttagaggt tagaaattgt tttgttaatt 3420ttttaatttt gaaagtaaaa aaggtgttta ataaatgtta taatataatt aaatatatta 3480agttttttaa gagtaggtta gtaattttgt tttattgaat tatataggta ggaggtaagt 3540ttttttagtt gtaataattt tagttttaat gtggatattg ttagtttttt tagatataaa 3600ttatttttgt ttagattgat aatttatgga ttatttgtga attaatgagt tgttataatt 3660aattatttta aattagttta agggtagatt ttgtatatgg ggattgttat tgtaaaataa 3720aataaaataa aaaaaaaatt ttaaggagat agaagtttgt tggttttgga ggattaagtt 3780attaaaaaat gttatttttt tattttttaa attgagaaag atgttttatt tataggatgt 3840aaggtaagtt tatttatata tatattattt tatatatatt ttatattttg gtttttataa 3900gtgttgttta gtaaagagga ggggaaggta ggtgtttttt agggagaaaa agtgttgata 3960tattgtaaga ggtattatcg tagttaggtt attttttttt tttgtgtgag ttttttgttg 4020acgttatttt ttgtttatgt ttagatttta ggaaatagag taaaaattgg tttttattaa 4080ggattaattt tttttttaaa gcgaaaaata aattttttgt tttattttat atatttttta 4140aatttttgga gtttggatta gtagtttaga gtttatagtg ttgagggaat ataattgaga 4200gattaaaatg gtgatgagta aaatgttatt gttaggtttg acgatagagt tgaagaagat 4260ttcgttgttt ttaaaattta ttttttaaaa ataattttaa aaagtttata ataattttgt 4320attttttttg gttttttaat tagtaataat gattaaatta tttatgtttt tgaatagtaa 4380ttagaaaata ttttgatata gttatttatt atagaaatta tagtgtttga gaatgattga 4440ttaaatagta gaaattttaa gaaatttatg ggttatttag atagtatata ttattttaaa 4500gggaaaaagt tattttatgt atttatttaa atttattaaa ataggtgttt ttgtgttgtg 4560gtttgtattt attggtttta taaaataaag tttttttttt ttattgatta atatttgaga 4620tttttatggg atgtttgttt agcgaggttt ttagtaataa agagaattaa tttgtggatt 4680ttaaaatagt tttgtttttt aaatatttgg tgttttttag ttttatgtaa aacgttaaat 4740agtatttatt ttttggttag tttgagtttg gatagaatta aatattatag aagttagttt 4800taagtattat attatttata taggattttt ttttgaattt ttgttttagt ttatgggttt 4860attttgtgtt ttaaaatata taaagttaaa gtatttagta tattgtttgt tataaagtag 4920gtttttaaaa ttaatgtttt ttattgtaaa tttaaaagat gttttaaggg gaaagaaatt 4980aatatttata tggggaaaat tatgaggtat aataggagat atttggggtt attgtaaagt 5040gatttttatt ataagtaatt aatttttatt attttatttt agttaggagg aggatataga 5100atattgatgt attataaatg tatatatata tatagagaga atttttagaa attattgttt 5160ttttttatat tttttttttt ttaaatttta gagtattgat agttaaatgt tttagattaa 5220gtgatttata agtttatttt gttagatatg gagggttgag agtttttata gttttgttaa 5280tgagtgtttg tatagtagtt tttatgttat ttgttaagaa gaaatagata ttggttatta 5340atgtaaaagg tattcgtatt ggtttatgaa atattagtat gtatattttt ttaaatattt 5400tttataaaag attaagaaat atcgtgttat atgttaaatg tagggttttt aaagttttta 5460gtagatgtga gaaatgtgtt tttattgata gaggggtcgg gtttttaaag tgttatatta 5520taggtaattt tagggtgaga aaaggagtgg aaatgagtgt tcgtttttgt ttgggaggta 5580gatgatgtgt ttgtagtata gggtgtagga ggtggagagg gaagaagatg tcgaatgagg 5640agagtagagt gttgggaaag gattttagta gatgatagag tagtgaaatt 5690 27 17527 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 27ggaattagaa tagtcggttt atttatttta ttattttatt attatatatt tttaaaggat 60tttttagata ttttgtaaga aataatgaaa tttattttta ttttataatt ttaaatagat 120tttttggtag tagtgatttt ttaaaatcgt taaggtttag ttttttttat tgttgaaaaa 180ggaggatttt gtattttttt aggggaagag tgttgttttt atattaatta gtcggggata 240gtatgaggtg tcgtttagta tttataggaa aaggtttttg aaattagatg ttttttaaat 300ttttatatta atttttggag ttgggtaata tggttttttt tttttttagg ttttgtggta 360gttattttgt tgttattcgt ttttgggttt tgtattttta atttttttgt taaatttgtt 420ttttttagaa tcgaggttat taagttatag atggttttat aaatggattt ttaaattagt 480ttaattaata atttttatcg aggatttttg gattgattcg ttggtagttt ttttggttta 540gagatttttt ttttggagga tattataatt gtagggtttt attatcgttt ttatatagta 600ggaagtagtt agagcggtta ttggttaaat ttttaatagt agttggggtg ttttgtttag 660aggggggatt gagaggtgat agtttgttgg tagtttttat agttttcgtt cgtttttagt 720attttttttg tttgggtttt tattttggcg gtatttgagg agttttttag tttattattg 780aaatattttt aaataaggaa gaggaatagg ttatgattta atgtttgttt ggattagtat 840aagtatgtta gggtaaatat ttatgttaaa ttgtgggagt taggaatata aagtatattg 900atttattaaa gttagtagat atttaagaat gttagtatag gtttttgaat aaattttgtt 960tttaagagaa gttattattt atttttaatt agatggggag gaaagttttt gaagaagaat 1020ttttatttta tttttttttt tttttttttg agatagagtt ttttttagtt atttaggttg 1080gggtgtagta gcgcgatttc ggtttattgt aagtttcgtt tttcgggttt acgttatttt 1140tttgttttag tttttcgagt agttgggatt ataggtgttc gttattatgt ttggttaatt 1200tttttgtatt tttagtagag atggggtttt atcgtgttag ttaggatggt ttcgattttt 1260tgatttcgtg attcgtttat ttcggttttt taaagtgttg ggattatagg cgtgagttat 1320tgcgttcgga ttaatttttg tatttttagt agagataggg tttttttatg ttggttaggt 1380tggttttaaa tttttgtttt aaggtgattt gtttatttgg gatttttaaa gtgttggggt 1440gagaggtgtg agttatcgtg tttggttatt tttgatattg ttaatgtatg tttttatttt 1500gaaaaaggtt ttttgttgtt tatttattta tttttgagat agagttttat tttgttgttt 1560aggttggagt gtattggtat aattttggtt tattgtaatt ttcgtttttt ggtttgaaga 1620tttttttgtt ttagtttttt gagtagttgg gattataggt acgtgttatt atgtttggtt 1680aattttcgta ttttttgtag agttggggtt ttattatgtc ggttaggttg gttttaaatt 1740tttgatatta ggtgatttgt ttatttcggt tttataaatt gttgtgatta taggtataag 1800ttattgtgtt tggtttaatt gttttttatt aatattgtat taggttggga agattaattg 1860ttttagtaat ttttaaattt taatggtgta agaaaataaa aattttattt tttgtttatg 1920ttatagttcg gtgtaggata gtgagaagga tttgtttttt tttgttattg gagatttagg 1980ttgtttttgt gtagtgttta gaaaagtttt agtagttgag aggtgaaaag gtgtggagga 2040ttgtatggaa ggttttataa gttaagttta ggggttgttg aattttatgt ttttttatat 2100tttattggtt agaaattagg tatagtatta tatcgaattg gaaaggaggt taggatatgt 2160tgtttaatag gatgtttcga gtagtgtatt tagaagaatg aataggtttg gagatagttt 2220aagtttgttg tgtttttaat ttttttgggg gtattttttt tataatttat aatttttttt 2280tttttttttt tgagatggag ttttggtttg tcgtttaggt tggagtgtaa tggtgtagtt 2340ttagtttatt gaaatttttg tttttcgggt ttaagtgatt tttttgtttt agtttatcga 2400gtagttggga ttataggggt ttattattat gtttggttaa tgtttgtatt tttagtagag 2460atggggtttt attatgttgg ttatgttggt ttcgaagtgt tgatttcgtg atttgttcgt 2520ttcggttttt taaagtgttg ggattatagg cgtgagttat tgttttcggt tataatttat 2580aattttaaat ggaaaaggta aagataaata ttagtttttt attagtaagg atatatatgt 2640agttgttgta ataaaggtaa aataaaaaaa tataatgtaa taatttaaat aagatatagt 2700attttttttg tttgtataaa aatttgaata aagtatttta gggttgacgt ggcggtttta 2760tagaattagg tattaaaggt ttttggtata ttgttttgtt ttttcgatta tttaattttt 2820tttttattat ttgagatgat aattttattt ttattgtagt gtttatattt tggtaaattg 2880gaaagaggag aagggtaagt ggaaagtaag tttttttttt taaaggtata atttaaaagt 2940tgtttatgtt atttgtgttt atgttttatt ggttaaaatt tagtaattaa attttggtaa 3000gtatttttgt tgtagtggga gttgggaaat gtagattttt gtttaggtaa gaaagaagag 3060ggtatggagg gtatagtttt tatattttag attttagtta tggcgttata tttcgttgta 3120agggaggtta gttattgtag tttttcgttg ggtggttatg tatttagtta gattttaggg 3180gtatttttat taaagtaatg tatggagaat ggatagtatg agaagtagtt tttgttataa 3240gtgtttttta taaaaagaat ttttataaga aaaataaata gggtttaagg aaaattaatt 3300taaagggtaa aatatgggga aaagataaaa aataaaagaa aaaagaaaag taagtttttt 3360aggtagaaaa tgaatgaaga ttgaggtata taagtgagaa gttttgtaaa attgataatt 3420ttttttattt tgttataaaa gtttttattt atattttaaa attttattaa atgttatttt 3480tttgatattt ttattttatt tttttttttt tgggtattta ttatgttgta gtgtatttta 3540ggttattttt agttttgtaa tttttttaag gtgattttgt aggagatgta aagtagttaa 3600gaggagaatt tttaatattg atgtgtttat aggtgaggtg gtttgatgtt ttagatttgt 3660tttaaaatat ttttgtataa aataaaaagg ggaatagatg aaataagatt gataaaatgt 3720tgatttattg acgcggtgta atgggtattt gggtgattat agtataattt tatttttttt 3780gtatatattt taaaattttt ataatatagt aaaatatgag tttagttttt taaggtagtt 3840agatttgggt ttaaatttta gtttgatttt ttattcgttg agtgatttta ttttgttata 3900gttttagttt ttttaaatgg aaataatata tattttatta aggtttttgt aaatttttaa 3960gtaagaggga atttgaggtt ttagtatacg gttcggtttt taatagttgt attaattttt 4020attttatttt tcgaaacgga gtttgttttg ttatttaggt tggagtgtag tggtatgatt 4080cggtttattg taatttttat ttttagggtt taagtaattt ttttgtttta gttttttttc 4140gagtaattgg gattatagga gtgcgttatt acgtttagtt aatttttgta ttttttagta 4200gagacggggt ttcggtatgt tgtttaggtt ggtttttaat ttttgatttt aggttatttt 4260ttcgtttcgg ttttttagag tgttgggatt ataggcgtga gttattgcgt ttggttagta 4320gttgtattaa taagggtttt tgtttgcgag taataaagat tgattttagt tgtggttaat 4380tttttttata tatatatatt aagtgttaga ggtaggattt gagttcggat ttttgatttt 4440tagatttaga attttttatg tgttattata gtcgttaaaa attttatttg gatttgtgtt 4500ttgtaattta cgttttcgaa tatgtaggaa tgtagtttgg gtatttgttt ggaatttcgg 4560attttcggga ttttagggtg gttaaggcgc ggaggtgatt taatgatatt gatcggtttg 4620gatgtacgtg ggttgttgag tcgatgttgg gaaggtacgg ggtttgttcg gtgtaggtcg 4680tcggaattta cgtacgtttt tgtttttttt atttttgggg tcggttttgg tcggtggttt 4740ttagtttagt tagcggtcgg acgcgtagtt cgtcgattag ttttttaggt tttagcgcga 4800ttttcggatt tcggattcgg cggatttggt cgattattta tttttttttt ttcgtaagtt 4860agggggcggg gtatcgggtt tttggttcgt gatttgtcgg agtttttgcg tttttttttt 4920ttattttttt cggttgtgtg agaggttagt agaggggcgg tttgcgggga taataatggc 4980ggggttttgg gtcgggatag tatcgttggt cgttgtcgga cggcgtgggc ggtggtcgtc 5040gtagtagttg atgttgagcg cggcgttgcg gattttgaag gtgaggagta acggggtttc 5100gcgggttcgg gttttattgg gtttttagtc gtgtcgtttt tgggcggttg gcgtcgggag 5160agcgttggtt gggttcggtt gttttcgcgt ttcggtttcg tattagttat atcgtttgtt 5220tttttttttt tcggagttcg cgtggtagcg ggtttaggag gtatttttcg ttgtagttgt 5280ttttcgcggg gattttgcgg agtagagagg tttagggtag aggtagttgg gtgttcgtac 5340gtttttcgag gcggttgatg gttttgggta ggtatattgt tcgaggtttg tttttagggt 5400ttcgcggtat tggttttgtt ttaagttttt tagggtgttt ttttaggtgt ttttatagtt 5460ttcgtgtttt gttgtttttt tttagtattt ttgaagggat attgtgaatt gttgtttaag 5520tagtgttagg gttgtgagtt tgttttattt tttaaagtat tatattatgt taggattgtt 5580aatagatttt acgttttatt tgaaagtttg ttttaattgt atgatatttt agtttattgt 5640gtattaaatg tatttcgtga atttattttt tttttcggta tagtggtgag tttgattttg 5700gtattgtttt aaatatattt tatgattgtt ttgtatattt aggttgttat gatggtagat 5760tgataaatag gttggagtgt ttgtgtgtgt ttttgagttt tgtttttagt taatgtcgag 5820tttgtcgtta attttggggt atagattatt taatttattt tataaggttt gttgaggtat 5880ttgaatatat tttttaaaat gaaggttttt tgaaaattat ttgttagttg gtttagtgtg 5940tttgttaaat ttttttttaa aaaataatta ttaattggtt tttttttttt aatgtgttgg 6000tagagattgt attttgttta tttttgtgtt tttagtataa tgtttgatat aataggtgtt 6060gaatgtgtaa taatagagta gtattatgtt tgtgtcggta aagaattttt ttttggggtg 6120ggaagtattt ttgaagttta ttattatttt aggggaattt gagttgttgt ttagtttttt 6180tttgcgtttt ttttttatga atttgaaata tgttttattg agtttgtttg aagttgaatt 6240ttttgaagat tttaattttt tttatttttt tttttatttt tgtaaatttt ttggttggtt 6300gaaaagtagt tagttaattt tagggtttag tttagagaat tttgattatt tttttagtta 6360gttaatagag tttatttatt tttagggtat atgtagagtt tattttttag ttttatttgt 6420tttgtgtatt agttttttaa gtatattttg ttttaatgtt tagttttttt ttttgcgtaa 6480atgtttttag tggttttagg atgttggttt tatggtaatt gttatagtta ttattgaatt 6540tttatatgtt ttgtatgatt tttttttgtt tttttttttt tttgagatgg ggtttcgttt 6600tgttgttagg ttggagtgta gtggcgcgat tttagtttat tgtaattttt attttttggg 6660tttaagtgat ttttttgttt tagtttttta agtggttggg attataggcg tacgttatta 6720ttatcggtta attttttttt gtattttagt agagatgggg ttttattatg ttggttattt 6780cgattttttg attttttgat ttattgtttt ggttttttaa agtgtttgga attataggta 6840tgagttatcg agtttaatgg tgtgattttt tatatatttt ttatttttat aataattagg 6900taaaaaattt taattttata gtagaggaaa taaagtttag ggtagttaag tagttgttta 6960aaagtataat tggttgaagt agaatttgaa ttttagataa tatgattttg aaggtttttt 7020tttttttttt tttttttttt ttttgagatg gggtttggtt ttgttggtta ggttggagtg 7080tagtggtatg attttggttt attgtagttt ttgttttttg ggtttaagtt atttttttat 7140tttagttttt taagtaggtg ggattatagg tacgtacgat tatatttggt tattttttaa 7200ttttaatttt tattttttgt agagatgggg ttttgttatg ttgtttaggt tggttttaaa 7260tttttgaatt taagtaattt atttatttta gtttgttttt ttaattataa attgttttat 7320ttgaattatg gttttattgt gtgatgtatt tatgaaattt gaatgtttaa gttttgtgtt 7380atttgatatt tattattttt ttttgtaatt agtaaatatg gaaaagaatg tttaggttta 7440tatgaatgtt ttagaattgt ttggaggtta atgtttttaa tatgttgata aatttttgat 7500aaattatttg ggaaaagaaa tttttgagat tattatagaa attagttttt ggtgtaaaaa 7560aatgtttata gatatttata tatttatata tttattattt ggattttatt ttgtttttga 7620gaggtttaga atagaggtaa aaattgtttt agtttttttt taagaggaaa agatgtgata 7680tttttgatga agagtgaggg aaaaggattt gtttaaatga ttttaaattt taaaaaatgt 7740aggtgggaga ataaggatga aaaaggaatt tgggaagaaa tatttttttg gtggggttgg 7800aaatatagtg ttttattgta ggtatttgga gttagatgtt cgtaggagtt atgttgaggt 7860gttgggtatt agtggttggt ttttgggtta gggatacgag gttagagtta gagttagaat 7920tgtgagtttt gacggatata gtgagttagt taatatttaa ttgaataaat gtttcgtttt 7980ataattttaa attaggattt ggaagaagga agaagagata agaggagtta gaggtatggt 8040ttgagaggag ttaatgtagt gtagtgttat taaatttagg aaagaaattt taagaagtag 8100ttagtattta tttatttatt tgtttagaga tttagttttt tatttagaaa gtgtttgtgg 8160agtatttttt aagttttagg tattatggta cgtatagagg agagaaaaag aaattaaaat 8220atatttttta attatgtttt aggtgtagag aggttaagga ataaaagatt gatgaggtta 8280ggtgtggtag tttacgtttg taattttaat tttttgggag gttaaagtgg gaggattttt 8340tgagtttagg agtttgagat tagtttaggt aatataatga tattattttt attttcggtt 8400atttttataa aataaaataa aataaaataa aaattagttg ggtgtggtgg tacgtgtttg 8460tggttttagg tatttgggag gttgaggagg gaggattatt tgagtttagg aggttaaggt 8520tgtagtgagt tgtgattata ttaatgtatt atagtttggg tgatatagta agattttgtt 8580ttaaaaaaaa gtttgggtac gatggtttat gtttgtaatt ttagtatttt gggaggtcga 8640ggtaggtaga ttatttgagg tcgggagttt aagattagtt tgattaatat ggagaaattt 8700cgtttttatt aaaaatataa aattagtcgg gtatggtggc gtatgtttgt aattttagtt 8760atttgggagg ttgaggtagg agaattattt gaatttagga ggtggaggtt gtagtgagtc 8820gagattgtat tattgtattt tagtttgggt aataagagcg aaaatttgtt ttaaaaaaaa 8880aaaaaaaaaa aaaagattgg tgaaagaatt tgaaaagatt tttgattttt aatgagaata 8940attttagtag tatggtaaag tgttatatat aaaaaatatt gtttttgata atatttttga 9000atagttgaag taaaattata ttttttgaaa gataagtata ttgtataatt tttaaaaatt 9060agttttttta ttttaaatgt ttattgatat tttcgttaga aaaaatttta taaattgatg 9120ggattaattt aataagatta aaataaaagt gaatttaaag aatgttggaa gatatagttt 9180tgtgatttta tttataaaat ttaatatagt atttatgtgg tatatttttt ttggtattgt 9240ttgtttgttt ttgagataga gttttatgtt gtttaggttg gagtttagtg gtgtgatttt 9300cgtttacggt aattttcgtt ttcggggttt aagtgatttt tttgttttag ttttttgagt 9360agttgggatt ataggtatgt gttattatgt ttagttaatt tttatatttt tagtagagac 9420ggggttttat tatgtcggtt tggttggttt tgaatttttg attttaattg attcgtttgt 9480ttcggttttt taaagtgttg ggattataga tgtgagttat cgtgtttgtt ttttttttgg 9540tattatttat ttaagaaatt tttggttttt tagagttgtt gtataaatga ttatggattt 9600ggtggtttaa aataataaat ttattttttt atagtattaa aggtttgaag tttgaaatta 9660aggtatgagt agggttatgt ttcgtttgaa ggttttaggg gagaattttt ttttgttttt 9720ttgagttttt ggtggttgta tttatttttt ggtttgtggt tgtattattt tagtttttgt 9780ttttgttttt atatggttgt tttttttttt ttttttttgt gcgttttttt tttttatttt 9840tttataaaga tattttttat tggatttagg gttatgataa gatttaggat gattttattt 9900taagattttt tattttgttg tattggtaaa gatattttat tataggtttt aggacgtgga 9960tatattattt taggggttat cgtttaattt atttatacgt agtatgtgtt agatattatt 10020tagagttggg aatataattg tgattgtttt tgtttttatt gtggttatat ttgagtaagg 10080agattgtgtt cgtataaata gaaaagttta gagagtgaga agtgttttcg aaggaaaaag 10140ataggttaat gggatagaga gtggtagtgg tgttgagttg gggatgttat ttaatgagat 10200tatgggggat atttttgagt atgtggtatt tggataggaa attgagttag ttagttatgt 10260gattatatgg gggtttagta ttgtagatta aggagtgtta gggtaaaagt tttgagggga 10320gattgtattt ggtataatta agggatgaat gtggttgttg tggttggagt gaattgaatg 10380agggggtgat tttaggagat gagggaggag gagtgggtag gcgggataga gttattaggg 10440gtttgtattt ggaatttagt aatgagagtt tagttggagg tatttaagta tattgaattt 10500atgtttggaa aagacgtttg tgattagtac gtagcgaatg ttttagtagg ggtgggagta 10560ggattgggga ttggggtggg aagagtggaa atagagagat ttattaggaa gttgttgtag 10620aagattaagt tagagatgat ggtaatttgt gttagggtat tggagttgtt gagaattggt 10680tagatttgga atgtattttg gagttagagt tagtattttg ttgtggggtt tgaaggtaga 10740tatagatgta ttttatattt tggttttatt gattttgtag atattgtttt ttttttgttg 10800tttttataga ttgagggttt gtggtaattt tgttttgagt aattgtattg gtgttatttt 10860tttaatagta tatatttatt tggtgttttt gtgaaatatt ttgataattt ttttattatt 10920attatgtttg ttatggtgat ttgtgattag tgattttcga tatttttatt gtaaatattt 10980tggggtgtcg tgaattacgt ttatataagt tggagaaata taattgataa atgtgtgagt 11040tttgattttt ttaagtagtt atttttttat gttttttttt ttttttaggt ttttttaatt 11100ttttgagata taataatatt gaaattaggt taattaataa ttttttaagc gttttagtga 11160aaggaagagt tatatatttt ttattttgaa ttaaaaatta gaaattatta agtttagtga 11220ggaaggtttg ttaaaagtta agatagattg aaagttgggt tttttgtgtt aaattgtaaa 11280tgtaaaggaa aagttttgga aggaaattag aagtgttatt ttagtgagcg tataattgat 11340taaaaaaagt gaaatagttt tattgttgat atggcgaaag ttttagtggt ttggatagaa 11400gattaaatta gttataatat ttttttaagt tatagtttaa tttagcgtaa ggttttcgtt 11460ttagttttgc gaaggttgag agaggtgagg atgttgtaga agaaaatttg gaagtagagg 11520ttggtttatg gggtttaaga aaagaagtga ggtcgggcgt agtggtttat atttgtaatt 11580ttagtatttt gggaggtcga ggcgagtgga ttataaggtt aagagattga gattattttg 11640gttaatatgg tgaaggatta gatgattgtt agtatttttg agtaataatt gttttgaata 11700ataattaatt ggatttgaat ttatagtatt tgtaaggtat gtataaatag ggaaaggaag 11760gaattaagag tgatttttga agggtagata tataaggtcg ttattgtgtg attttgtgtt 11820tatatgtagt ttttagaata gattgattta tgaagataga aagtagatta gtggttgttt 11880agggtttgga ggagagggga tgggagtgat tgcgaatagt taagggttgt ttttttgggg 11940tgataaaaaa tgttttggaa ttagtagtta ttatggtttt atgttttgtg gatatattaa 12000aaattacgga gttgtatatt tttttaaaag ggtgaatttt atggtatgtg aattatattt 12060taattaaaaa ataaaagaat ggttcgggtg tagtggttta tatttgtaat tttagtattt 12120tgggaggtcg aggtaggtgg attatttgag gtcgggagtt cgagattagt ttgattaata 12180tgaagaaatt ttatttttat taaaaatata aaattagtta ggtatggtgg tatatgtttg 12240taattttagt tattcgggag gttgagacgg gagaattgtt tgaatttggg aggtagaggt 12300tgtagtgagt taagatggta ttattgtatt ttagtttggc gatagagtga gatttcgttt 12360taaaaaataa ataaatataa attttcgaat atttatgtta ataaagtaaa gtaaagaggt 12420taaggtggga ggattatttg aggttagtag tttaagatta gtttggggaa aatagtgaga 12480attttttagt cgtttagttt ttataaaaaa taaaaaaatt agtggggtat ggtgatatgt 12540atttatagtt ttagttattt aggaggttga ggtgggagga ttgtttgaat gtaggagttt 12600aaggttgtag tgagttatga ttttattatt atattttagt ttgggtaata tagtgagatt 12660ttgttttaaa aaaaaaaagt ataatgaagt taggtgtggt ggtagggatg tgtagtttta 12720gttatttagg aggttgaggt gggaagatta tttaagttta ggagttagag gttgttatgg 12780gttataattg tgtttgtgag tagttattgt agtttagttt gggtaaatat agtgagattt 12840ttatttttta aaaaaataaa aaaagtaaaa taaggtgaaa ttaatatatt ttatttaata 12900tatttaaata tttaaagtat tatttgaata tgtaaatgta aaaatttatt aatgaggttt 12960tttatatttt ttgggtatta agtttttaaa atttagtgtg tagtttattt ttagagtata 13020tttgaatgtg gttcgtggtt gttatattgg atggaatagt tttagggtat agattgtgtt 13080attaattaag ttttattttg aggtgttggg attggttttt tgaatgtagt gttagttagt 13140ttttggttag gtagggtcgg gggagttttt aggtttgatg gagagttgta tagttgagga 13200atatggtcga gatgagggtg taggtgtgag tcgttagttg ttaatatagt agttagagag 13260gatttgagtg gttattgata atatttgtta tagcgggatg gggaagaatg gtttggcgga 13320agagttaagg gtgggatgat ggagttttag agttgatatg tatagttttt tggtgtttga 13380gtttagtata gaggtagagt ttagagaatt ttgagttttg aatatttttt ttaaatatta 13440ggtgtttaat ttggtttttg gtagatattg aagattggaa tggtttttaa gattttgaag 13500attaaatagt ttatttgaaa gaaaagttgt gtttttagga aaaagttaga tttaattaag 13560tgtttttaga gaagggtatg ggttttgtta taatgtatga tgaaatatcg tgttataata 13620tatggataag atttttattt ggaattttag agatgaagta agatgaagta aattaatgtt 13680tattttgatt ttggtgagat tattttatag ttttattaat ttagttttga ggatagtttt 13740ttttttgaag tagaatgtat tttgataatg aatttatttt ataatgagtt atttagtatt 13800atttatttga atgttattgc gggtatgtta ataatagtag ttttggtttt ggtagaaata 13860gtgtttagat tgttttttaa gatatttgtt agtggattta ttagttttaa ttgttacgtg 13920aggttatatt ttgtttatga aagtaggtgt tatttaattt tttttttttt tttttttttg 13980agatggagtt ttgttttgtt atttagattg gagtgtagtg gcgtgatttc ggtttattat 14040aatttttgtt tttcgggttt acgttatttt ttcgttttag tttttcgagt agttgggatt 14100ataggcgttt gttattatat tcggttaatt ttttgtattt ttcgtagaga tagggtttta 14160ttgtgttagt taggatggtt ttaatttttt gattttgtga tttatttgtt tcggtttttt 14220aaagtgttgg gattataggc gtgagttatt gtgtttagtt ggtgttattt aattttaaga 14280aaggattttt ttttagttat tgtaaatagg atttgttttt ttgtttgtag tggttggaag 14340gtatgtattt agtttgttta aaagtttatt atttttttcg ttttttgtgt aagttattgt 14400gtgttgatga taatatatgt aagattgtgt tagttatgtt agatattttt atttaatttt 14460tatagtagta ttatgattta gataagtatt attattattt ttagtgtata aatgaagaaa 14520ttttttatat atttaggaaa tgttagagtt aagatttgaa tttaggttag aatttgagtt 14580tagattagaa tttttattga ttatattatt ttttaatggt aatttttaag tggttttggt 14640ataattttaa gaaagaaggt gatagttata tatttggatt tagtttttat gtaaaatttt 14700atattttttg gtattttatt gtttataaaa atttatttga tttttttaat aattttttag 14760gaaattaggg aggtgttatt atttatattt tgtagatgga aacgggggtt tagagaaatg 14820attagtttaa tgatttatag ttgagagttg atttaagttt tgtgattttg agggttaatg 14880ttatttttta tgtgttaagt tatttttagg tatttttttt ttatgtgtgg aaaatatagg 14940aaattattat ttttgtggga gagaattagt ggtaatatgt tattggggag ttattttgta 15000tacgttgatt ttttttattt tggttgtgat tggttagttt ttataaatag aattgattaa 15060agtttttttt tagaattttt gttgttagga aatattttat aaagaatttt ggattgggcg 15120tgtagttagt ttgttatatg tttaataaaa ataataaacg ttaaaatttt gtgtagaggt 15180ttaaattagt agattttttt aaacgttttt ttttatttag aaaataaatt ttatgttgtg 15240gttttatata aatggtttga gtgttgattt gattttttat ttttgatttt ttatgaatgt 15300tttttaggag gaaataggaa tagagttttt atggggttta ttttaaatta gtttagattt 15360gtcgtgggaa tggtttatat tggtagttgt tttgttatag ttgtgtttgt ttgtacgagt 15420tttatttttt tttttttttt tttttgttga gatagtgttt cgtttttttt gtttaggttg 15480gagtgtaacg gtataaattt ggtttattgt aatttcggtt tattgtaatt ttcgtttttc 15540gggtttaagc gatttttttg ttttagttat tcgagtagtt gggattacgg gtatgtatta 15600ttatgtttag ttaattttgt atttttagta gagatggggt ttttttatgt tggttaggtt 15660ggtttcgaat ttttaatttt aagtgatttg ttcgttttag ttttttaaag tgttgggatt 15720ataggtatga gttatcgtgt tcggttcgag ttttattttt agttattggg taatcgggag 15780gtatttatgt tttttatagt tttaggttat attattataa gtttatatgt gtgtaagttt 15840tgtggaataa tattatattt ttgagtagat attagtgttt atttgggaat tgttattgtt 15900ttttttattt agaaataaaa aattttagaa agtttttgat taatttgtgg ttaaatttta 15960taattattat agttttagtt tgtgattttt gaaaagttaa agtttttggg atttaatttt 16020gttataaaat tggggataat atttttgtaa tttatagtta tgtttgaagg aatatatgag 16080agatagtttt gatttttaat agggatatag taataatttt tcgtttatag tttttttttg 16140tttttggttt tttatttggt aaaggtttta ttttataaat tatatttttt tgtatttttt 16200atttttattt ttatatagag attatatttt ttaaattaat taaataatta attaattttt 16260tttgaggagt ttcgtttttg ttgtttaggt tggagtgtaa tggtaggatt taggtttata 16320gtaattttta ttttttgggt ttaagtaatt ttattttagt tttttgagta gttgggatta 16380taggtgtgtg ttattatgtt tcgttaattt ttttgtgtgt gtttttagta gagacgggat 16440ttcgttattt tggttagttt ggtcgtaaat ttttgatttt aggtgattta tttgttttga 16500ttttttaaag tgttaggatt ataggtatga gttatggtgt tcgatttttt aaaaaatagt 16560tgtataaatt ttttagttta tttaaaaatg ttgttataag aatattttgt tttttatttg 16620agtcgttatt attttagaaa gttttaagag gtggtatttg ttggttgttt tttgttggtt 16680tttttttttt attttttttt ttttagtttt aatagtgatt attgggaagt tttttttttg 16740tttttgtttg tttttttgta tttttttatt tttttttttt tttttttttt tttttttttt 16800ttttagtggg gttttgtttt gttgtttagg ttggagtata gtggtgtgat tttggtttat 16860tgttatttta aattttgggg tttaagtaat atttttattt ttgttttttg agtagttggg 16920attttaggtt gtattatcgt gtttggttta gttatttttt ttaatgtttt taagtattaa 16980gatacgtttt ttttataaat agtttaatga atgagaaata tttttgatta ttgatattgt 17040ttttttatat ttattagtta aattattttt gtattagaaa atgtgaaata agaaattatg 17100ttgaagatat tagtaaatat aaaaagaata ttttattatg ttttggttat tgttaaattt 17160gaagtttttt gagattaaga ttttcgtttt gtgtttttaa aagttttgtg tggtttgtga 17220tatttttgat tttgttttat ttttttgaat gattagaaag gtttttttta aatttgtttg 17280gtttttcgat aatttttgtt ttgttttttt ggagatcgtt ttgatgtttt tggttttttt 17340tatatattaa ggggttgtgt ttgtagatat gatttttttt ttgtaattat atttatggta 17400tattgtttag aattatattt attgattaga tacgttcgtt agaatttaat tggaagaaat 17460attttgaaaa aatgttttaa agtttattaa gtatttgtaa tttattttgt tttttttttt 17520ttgtagt 17527 28 17527 DNA Artificial Sequence chemically treatedgenomic DNA (Homo sapiens) 28 gttataaaaa aaggaaagta aaataaattgtaaatatttg atgggtttta gaatattttt 60 ttaggatatt ttttttagtt aggttttagcgaacgtgttt gattaataaa tgtagtttta 120 ggtaatatat tataaatata attataaaagggaaattata tttatagata tagttttttg 180 gtatgtaaga gaaattaaaa gtattaaaacgatttttaga aaagtaaaat aagaattgtc 240 gaggggttaa gtaaatttga agaaagtttttttgattatt taaaaggata gagtagggtt 300 agaaatgtta tagattatat agaatttttaaaaatataaa acgagagttt tggttttaag 360 gagttttaaa tttaatagtg gttagaatataataaaatat tttttttata tttgttgatg 420 tttttagtat gattttttat tttatattttttggtataga agtggtttgg ttgataaata 480 tgaaaaagta atattagtaa ttaaggatattttttattta ttgaattgtt tgtgaagaaa 540 gcgtatttta atgtttaaaa atattaagaaaagtgattaa gttaggtacg gtggtatagt 600 ttggaatttt agttatttag gaggtagaggtgggagtatt atttgagttt tagagtttga 660 ggtggtagtg agttaagatt atattattgtattttagttt aggtaataga gtaagatttt 720 attgaaaaga gagaaaagaa aggagaaaaagaaaagagat agagagatat agagagatag 780 atagagatag agagagaatt ttttagtagttattgttaaa gttagaagga aaaaaatgga 840 ggaaaaaaat tagtaaaagg taattaataggtattatttt ttagaatttt ttaagatgat 900 aacgatttaa ataagaaata aaatgtttttatagtaatat ttttaaatga attgaaaaat 960 ttgtataatt attttttaaa gagtcgggtattatggttta tgtttgtaat tttagtattt 1020 tgggaggtta aggtaggtgg attatttgaggttaggagtt tgcgattaga ttggttaaaa 1080 tggcgaaatt tcgtttttat taaaaatatatataaaaaaa ttagcggggt atggtggtat 1140 atatttgtag ttttagttat ttaggaggttgaggtagaat tgtttgaatt taggaggtgg 1200 aggttgttgt gagtttagat tttgttattgtattttagtt tgggtaataa gagcgaaatt 1260 ttttagaaaa aattaattaa ttatttaattaatttaaaaa atgtaatttt tgtataaaag 1320 tggaggtaaa agatataaaa agatatagtttataaaataa aatttttatt aagtaaaaga 1380 ttaagaataa gaaggaattg tgaacgggaaattattattg tgtttttatt aaagattaag 1440 attatttttt atatattttt ttaagtataattgtgagtta taagagtatt atttttaatt 1500 ttatgataaa gttgagtttt aaggattttaattttttaaa ggttataggt tgaggttgta 1560 atggttataa gatttaatta tagattggttaagagttttt tgaaattttt tatttttaga 1620 taagaaaaat agtggtaatt tttagataaatattaatatt tatttaaaga tatgatattg 1680 ttttatagag tttgtatata tgtgaatttgtaataatgtg gtttaaagtt gtaaaaagta 1740 tagatgtttt tcggttattt agtaattagaagtagaattc gggtcgggta cggtggttta 1800 tgtttgtaat tttaatattt tgggaggttgaggcgggtag attatttgag gttgggagtt 1860 cgagattagt ttgattaata tggagaaattttatttttat taaaaatata aaattagttg 1920 ggtatggtgg tgtatgttcg taattttagttattcggatg gttgaggtag gagaatcgtt 1980 tgaattcggg aggcggaggt tgtagtgagtcgaggttgta gtgagttaag tttgtatcgt 2040 tgtattttag tttgggtaaa aagagcgaaatattgtttta ataaaaaaaa aaaaaagaag 2100 aagtagaatt cgtataagta aatataattataatagaata attattaatg tgaattattt 2160 ttacgataag tttgaattgg tttggaatgagttttataaa ggttttgttt ttgttttttt 2220 ttgggagata tttatggaag gttaaaaatgaagaattagg ttaatattta gattatttgt 2280 gtaaagttat aatataaagt ttattttttaaatgaaggaa aacgtttgaa gaagtttgtt 2340 aatttggatt tttatataga attttaacgtttgttgtttt tgttaagtat gtaataaatt 2400 ggttatacgt ttagtttaaa attttttgtaaggtattttt tagtaataaa ggttttgaga 2460 aagaatttta attaattttg tttataaaggttagttaatt atagttaaaa tgagagaggt 2520 tagcgtgtgt aaaatgattt tttagtaatatattgttatt ggtttttttt tataggaata 2580 atgatttttt gtatttttta tatatagaaaagaaatgttt gaaaatggtt tggtatatag 2640 gaagtggtat tgatttttag agttataagatttgggttaa tttttagttg tgagttattg 2700 agttaattat ttttttgggt tttcgtttttatttataaaa tgtaggtgat gatatttttt 2760 tgatttttta gggagttatt aaaaggattaaatgagtttt tataaatagt aaagtgttaa 2820 aaaatgtaag gttttatatg aaaattaaatttaaatatgt aattgttatt ttttttttta 2880 aaattatatt agaattattt gggaattattattagagaat aatatagtta ataagagttt 2940 tggtttagat ttagattttg atttggatttaaattttggt tttgatattt tttagatata 3000 tagaaagttt ttttatttgt atattggggataataatagt atttatttag gttataatgt 3060 tgttatgagg attaaatgag aatgtttaatatggttagta tagttttgta tatattatta 3120 ttagtatata ataatttata taaaaagcgggggaaatggt aggtttttag ataaattgga 3180 tgtatgtttt ttagttattg taaatagggaaataaatttt gtttgtagtg gttggaaaaa 3240 aatttttttt taagattaga tagtattagttgggtatagt ggtttacgtt tgtaatttta 3300 gtattttgag aggtcgaggt aggtggattataaggttagg agattgagat tattttggtt 3360 aatatagtga aattttgttt ttacgaaaaatataaaaaat tagtcgggtg tggtggtagg 3420 cgtttgtagt tttagttatt cgggagattgaggcgggaga atggcgtgaa ttcgggaggt 3480 agaggttgta gtgagtcgag attacgttattgtattttag tttgggtgat agagtaagat 3540 tttattttaa aaaaaaaaaa aaaaaaaagattagatagta tttattttta taagtaagat 3600 gtggttttac gtggtagtta aaattggtaaatttattggt aaatatttta aagaataatt 3660 tgaatattat ttttgttaaa attaaaattattgttgttaa tatattcgta gtagtattta 3720 gatgaataat attaaataat ttattatgagataaatttat tattagaatg tattttgttt 3780 taaagaagaa attattttta aaattgggttaatggagtta taaaatgatt ttattaaggt 3840 taaagtaaat attagtttat tttattttgttttattttta aaattttagg tgaaggtttt 3900 atttatgtat tatgatacgg tattttattatgtattgtaa tagagtttat gttttttttt 3960 gaagatattt aattaggttt ggtttttttttggaagtata gttttttttt taaatagatt 4020 atttagtttt taggatttta gagattattttaatttttag tgtttgttaa aagttaagtt 4080 gaatatttaa tatttgagag agatgtttaagatttaagat tttttgggtt ttgtttttgt 4140 attaagttta agtattagga aattatatatgttaatttta gagttttatt attttatttt 4200 tgattttttc gttaggttat ttttttttatttcgttgtag tagatgttgt tagtggttat 4260 ttagattttt tttaattgtt gtgttgataattaacggttt atatttgtat ttttatttcg 4320 attatgtttt ttaattatat agttttttattaagtttgag agttttttcg attttgtttg 4380 gttaagggtt gattaatatt gtatttaaaaggttagtttt agtattttaa ggtgggattt 4440 gattagtagt ataatttgtg ttttagagttgttttattta atatggtagt tacgagttat 4500 atttagatgt gttttaagag taaattatatattggatttt gaaaatttag tatttagaaa 4560 atgtaaaaga ttttattagt gaatttttatatttatatat ttaaataata ttttgaatat 4620 ttgaatatat taagtaaaat atattaattttattttattt tatttttttt gtttttttaa 4680 gagatggggg ttttattatg tttgtttaggttggattgta gtgattattt ataggtataa 4740 ttatagttta tggtagtttt taatttttaggtttaaatga tttttttatt ttagtttttt 4800 aagtagttga gattatatat ttttgttattatatttagtt ttattgtatt tttttttttt 4860 gagataggat tttattatgt tgtttagattgaagtgtagt gataggatta tagtttattg 4920 tagttttgaa tttttgtatt taagtaatttttttatttta gttttttgaa tagttgggat 4980 tatggatgta tgttattatg ttttattaatttttttattt tttgtagaga ttgggcggtt 5040 ggggggtttt tattattttt tttaggttggttttgaattg ttggttttaa gtgatttttt 5100 tattttggtt tttttgtttt attttgttaatataagtatt cgaagatttg tgtttgtttg 5160 ttttttgaga cggagtttta ttttgtcgttaggttggagt gtagtggtgt tattttggtt 5220 tattgtaatt tttgtttttt aggtttaagtaattttttcg ttttagtttt tcgagtagtt 5280 gggattatag gtatgtgtta ttatgtttggttaattttgt atttttagta gagatggggt 5340 ttttttatgt tggttaggtt ggtttcgaattttcgatttt aggtgattta tttgtttcgg 5400 ttttttaaag tgttgggatt ataggtgtgagttattgtat tcggattatt tttttatttt 5460 ttaattgaga tgtaatttat atattataaaatttattttt ttaaaaaagt atataatttc 5520 gtggttttta gtatatttat aaggtatggaattatgatgg ttattgattt taggatattt 5580 tttattattt taaaaagata atttttaattattcgtagtt atttttattt tttttttttt 5640 aggttttggg taattattaa tttattttttgtttttatgg attagtttat tttggagatt 5700 gtatataaat ataaaattat ataatagcgattttgtgtgt ttatttttta aaagttattt 5760 ttaatttttt tttttttttg tttgtatatattttatagat attgtaggtt taggtttaat 5820 taattattgt ttaaaatagt tattgtttaaaaatgttaat aattatttga ttttttatta 5880 tgttagttag aatggtttta attttttgattttgtgattt attcgtttcg gttttttaaa 5940 gtattgggat tataggtgtg aattattgcgttcggtttta tttttttttt taaattttat 6000 gaattaattt ttgtttttaa gtttttttttgtagtatttt tatttttttt agttttcgta 6060 gaattgaagc gaggattttg cgttggattaggttatggtt taaggaaatg ttgtggttgg 6120 tttgattttt tatttaaatt attaaagttttcgttatatt agtaataaag ttgttttatt 6180 ttttttaatt agttgtgcgt ttattggagtagtattttta attttttttt agaatttttt 6240 ttttgtattt ataatttggt ataagaggtttaatttttag tttattttgg tttttgatag 6300 gtttttttta ttaagtttaa tgatttttagtttttgattt aaagtgagag atgtgtgatt 6360 ttttttttta ttagaacgtt tagaagattattaattggtt taattttaat attgttgtat 6420 tttagagaat tagggaagtt tgaggagagggagagatata ggggaataat tgtttggaga 6480 agttaaaatt tatatattta ttaattatgtttttttaatt tatatgggcg tggtttacgg 6540 tattttaaaa tatttataat aagaatatcgaagattattg attatagatt attataatag 6600 atatagtaat aatgaaaaaa ttattaaaatgttttataga gatattaagt aagtatgtgt 6660 tattggaaag atgatattaa tatagttgtttaaagtaggg ttgttataaa tttttaattt 6720 gtaaaaataa taaaaaaaaa gtagtatttgtagggttaat aaagttaaga tatgaggtat 6780 atttgtattt gtttttaaat tttatagtaagatattggtt ttagttttaa aatatatttt 6840 aagtttgatt agtttttagt aattttagtgttttagtata agttattatt atttttagtt 6900 tggtttttta taatagtttt ttgatgggtttttttgtttt tatttttttt attttagttt 6960 ttaattttat ttttattttt attaagatattcgttacgta ttagttataa acgttttttt 7020 taaatataaa tttaatgtgt ttaaatgtttttaattggat ttttattatt aaattttaaa 7080 tataagtttt tgatgatttt gtttcgtttatttatttttt tttttttatt ttttaagatt 7140 atttttttat ttagtttatt ttaattatagtagttatatt tattttttaa ttatgttaaa 7200 tgtaattttt ttttagagtt tttgttttggtattttttgg tttgtaatgt taggttttta 7260 tatagttata tggttggttg gtttagttttttgtttaaat gttatatgtt tagaaatgtt 7320 ttttatggtt ttattaggta atatttttaatttagtatta ttattatttt ttattttatt 7380 aatttatttt tttttttcga gagtattttttattttttga atttttttat ttatacgagt 7440 atagtttttt tatttaaatg taattataatgggagtagaa atagttataa ttatattttt 7500 agttttaagt agtgtttgat atatattacgtgtaggtgaa ttgaacgata gtttttaaaa 7560 tgatgtgttt acgttttgga atttgtgataaagtgttttt gttaatataa taaagtgaag 7620 gattttgaga tgaaattatt ttagattttgttatggtttt aaatttaatg aaaagtgttt 7680 ttataaaaga atgagaggga aagacgtataagaaggagga ggagaaggta gttatgtgaa 7740 gatagaggta gagattggag tgatgtagttataagttaag gaatgaatgt agttattaga 7800 agtttaaaga ggtaagaaag gatttttttttagagttttt aggcgaagta tggttttgtt 7860 tatgttttga ttttagattt taggtttttagtattgtggg agaatgaatt tgttgtttta 7920 agttattagg tttatggtta tttgtatagtagttttagga aattaaaggt tttttgaata 7980 aataatatta aagagagggt aggtacggtggtttatattt gtaattttag tattttggga 8040 ggtcgaggta ggcggattaa ttgaggttaagagtttaaga ttagttaggt cgatatggtg 8100 aaatttcgtt tttattaaaa atataaaaattagttgggta tggtggtata tgtttgtaat 8160 tttagttatt taggaggttg aggtaggagaattatttgaa tttcggaggc ggaggttgtc 8220 gtgagcggag attatattat tgaattttagtttggataat atgagatttt attttaaaaa 8280 taaataaata atattaaaga gagtatgttatatggatgtt gtattaggtt ttgtgaatga 8340 aattataaaa ttgtattttt taatattttttaaatttatt tttattttga ttttattagg 8400 ttgattttat tagtttgtgg ggttttttttaacgaaaatg ttaataggta tttaaaataa 8460 agaaattaat ttttgaaagt tatgtaatatgtttattttt taaaaaatat aattttgttt 8520 taattattta agagtgttgt taaaagtagtattttttgta tataatattt tattatgtta 8580 ttaaaattat ttttattaaa gattaaagatttttttaaat ttttttatta attttttttt 8640 tttttttttt tttttgagat agattttcgtttttgttgtt taggttggag tgtagtggtg 8700 taatttcggt ttattgtaat ttttattttttgggtttaag tgattttttt gttttagttt 8760 tttaagtagt tgagattata ggtatgcgttattatgttcg gttaattttg tatttttagt 8820 agagacggga tttttttatg ttggttaggttggttttgaa ttttcgattt taggtgattt 8880 gtttgtttcg gttttttaaa gtgttgggattataggtatg agttatcgtg tttagatttt 8940 tttttgagat agggttttgt tgtgttatttaggttgtagt atattggtgt gattatagtt 9000 tattgtagtt ttgatttttt gggtttaagtgatttttttt ttttagtttt ttaagtattt 9060 agaattatag gtacgtgtta ttatatttagttaattttta ttttatttta ttttattttg 9120 tagagatagt cgggggtggg ggtggtattattatgttgtt taggttggtt ttaaattttt 9180 gagtttaaga aattttttta ttttggttttttaaagggtt gagattgtag gcgtgagtta 9240 ttatatttgg ttttattaat tttttattttttagtttttt tgtatttggg atatagttag 9300 ggaatatgtt ttaatttttt ttttttttttttgtacgtgt tatagtattt ggaatttaga 9360 aaatgtttta taaatatttt ttgagtaaagagttagattt ttagataaat gaatgaatga 9420 atgttaatta ttttttgaaa ttttttttttaggtttggta atattatatt atattggttt 9480 tttttaaatt atatttttaa ttttttttgttttttttttt tttttttaaa ttttaattta 9540 gggttataaa acgaagtatt tatttaattaaatattaatt gatttattat attcgttagg 9600 gtttatagtt ttaattttaa ttttagtttcgtatttttgg tttaaaagtt agttattgat 9660 atttagtatt ttagtatggt ttttgcgggtatttaatttt agatatttat aatgaaatat 9720 tatgttttta gttttattaa aaaagtgtttttttttaaat ttttttttta tttttgtttt 9780 tttatttata ttttttaaag tttggaattatttaaataaa tttttttttt ttatttttta 9840 ttaaaaatgt tatatttttt ttttttagaaaaggattaga gtagttttta tttttgtttt 9900 gaatttttta ggaatagaat aaaatttaaatggtagatgt ataaatatat aaatgtttat 9960 aaatattttt ttatattaga aattagtttttgtaataatt ttagaaattt ttttttttaa 10020 atgatttgtt agaaatttat tagtatgttggaaatattaa tttttaggta attttaaagt 10080 atttatataa gtttaaatat ttttttttatatttattgat tataaaagaa aataatggat 10140 gttaagtaat atagggttta aatatttaaattttatgaat gtattatata atgagattat 10200 gatttaaatg agataatttg taattagaaaagtaagttga ggtgggtgga ttgtttgagt 10260 ttaggagttt gagattagtt tgggtaatatagtaaaattt tatttttata aaaaataaaa 10320 attaaaatta aaaaatagtt aggtgtggtcgtacgtgttt gtggttttat ttatttggga 10380 ggttgagatg ggaggatggt ttgagtttaggaggtagagg ttgtagtagg ttaagattat 10440 gttattgtat tttagtttgg ttaatagagttagattttat tttaaaaaaa aaaaaggaag 10500 aaagaaaaga aagtttttag aattatattatttaaggttt aaattttatt ttagttaatt 10560 gtgtttttaa gtaattattt aattgttttgagttttgttt tttttattgt aaaattggga 10620 ttttttattt agttgttata aggataaaagatatatgaaa aattatatta ttgggttcgg 10680 tggtttatgt ttgtaatttt aagtattttgggaggttaag gtagtggatt aagaggttag 10740 aagatcgagg tggttaatat ggtgaaattttatttttatt aaaatataaa aaaaaattag 10800 tcggtggtgg tggcgtgcgt ttgtagttttagttatttgg gaggttgagg taagggaatt 10860 atttgaattt aggaggtgga ggttatagtgagttgagatc gcgttattgt attttagttt 10920 ggtaatagag cgagatttta ttttaaaaaaaaagaaaagt aaagaaaaat tatgtaaggt 10980 atataagagt ttaataataa ttatagtaattattataaaa ttaatatttt agagttattg 11040 aaaatattta cgtagaagaa aaaattaggtattaaaatag aatgtgttta aaaagttgat 11100 atataaaata aataagatta aaaggtgaattttatatata ttttaaaaat aaataaattt 11160 tgttgattgg ttaaaagaat ggttagaattttttagatta gattttagag ttagttggtt 11220 gttttttaat taattaaaag gtttgtagaggtggagggag ggatgggagg ggttaaaatt 11280 tttaaaagat ttagttttaa atagatttagtagagtatat tttaagttta tagaagagaa 11340 gcgtagagag aagttaagta gtagtttaagtttttttaga gtgatagtga attttagaga 11400 tgttttttat tttaaggagg aattttttatcggtataaat ataatgttat tttattgtta 11460 tatatttagt atttattgtg ttaaatattgtattaagaat atagaaatag ataagatgta 11520 gtttttgtta atatattaaa aggaaaaaattagttaataa ttatttttta aaaggaagtt 11580 taataagtat attgaattag ttgatagatggtttttaggg gatttttatt ttaaagaatg 11640 tgtttaagtg ttttaataaa ttttataaagtaggttaggt ggtttgtgtt ttagaattaa 11700 cgatagattc gatattgatt ggagatagagtttagaagta tatataagta ttttaatttg 11760 tttgttaatt tgttattatg atagtttaggtatatagaat agttatgaaa tgtgtttaga 11820 atagtgttaa aattaggttt attattatatcgaaaaggaa agtaagttta cgggatgtat 11880 ttggtatata gtagattggg gtgttatataattaaaatag gtttttaaat gaaacgtaaa 11940 atttattggt agttttgata tggtataatattttaaaaga taagataaat ttataatttt 12000 aatattattt aagtaatagt ttatagtgtttttttaaaaa tgttggaaag aggtaataga 12060 atacggaaat tataaggata tttaaaaagatattttggaa agtttaagat aaagttaatg 12120 tcgcggggtt ttggaagtag atttcgagtaatatgtttgt ttaaagttat tagtcgtttc 12180 ggagggcgtg cgggtattta attgtttttgttttaggttt ttttgtttcg taggattttc 12240 gcgaggaata gttgtaacga gggatgttttttgagttcgt tgttacgcga atttcgggag 12300 ggaggaaagt aagcggtgta gttgatgcggaatcggggcg cgggggtagt cggatttagt 12360 tagcgttttt tcggcgttag tcgtttagaggcggtacggt tagaagttta gtgaagttcg 12420 gattcgcgag gtttcgttgt tttttatttttagggttcgt agcgtcgcgt ttagtattag 12480 ttgttgcggc ggttatcgtt tacgtcgttcggtagcgatt agcggtgttg tttcgattta 12540 gaatttcgtt attgttgttt tcgtagatcgtttttttgtt gattttttat atagtcggag 12600 ggggtggaga aggggagcgt aggagtttcggtaaattacg agttagaaat tcgatgtttc 12660 gttttttaat ttgcggaaag gggagggtgagtggtcggtt agattcgtcg gattcgggat 12720 tcgggagtcg cgttaggatt tggagggttagtcggcgggt tgcgcgttcg gtcgttagtt 12780 gagttggagg ttatcggtta gagtcgattttaggagtgag agagataggg gcgtgcgtga 12840 gtttcggcgg tttgtatcgg gtaaatttcgtattttttta gtatcggttt agtaatttac 12900 gtgtatttag gtcggttaat gttattgagttattttcgcg ttttggttat tttggagttt 12960 cgagaattcg aagttttaga taaatgtttaaattatattt ttgtatgttc gaaagcgtaa 13020 attgtaaagt ataaatttag gtaaggtttttaacgattgt aataatatat aaaaagtttt 13080 aggtttggaa attagagatt cgagtttaagttttattttt ggtatttaat atgtgtgtgt 13140 gaaagaaatt agttataatt agagttagtttttgttgttc gtaagtagaa atttttgtta 13200 gtataattat tggttaggcg tagtggtttacgtttgtaat tttagtattt tgggaggtcg 13260 aggcgggagg ataatttgag gttaggagttggagattagt ttggataata tgtcgaaatt 13320 tcgtttttat taaaaaatat aaaaattagttgggcgtggt ggcgtatttt tgtaatttta 13380 gttattcggg aggaggttga ggtaggagaattgtttgaat tttggaggtg gaggttgtag 13440 tgagtcggat tatgttatta tattttagtttgggtgatag agtaaatttc gtttcgaaaa 13500 ataaaataaa aattagtata attattaagggtcgggtcgt gtgttagagt tttagatttt 13560 tttttatttg agagtttata agaattttaatggagtatat attattttta tttggagaaa 13620 ttgaagttgt agtagggtaa agttatttagcgagtaaaag gttaaattag ggtttgaatt 13680 taaatttggt tgttttgagg gattgggtttatgttttgtt atattatgga aattttaaaa 13740 tatatataaa agagataaaa ttgtattatgattatttaga tatttattat atcgcgttaa 13800 tgaattaata ttttgttaat tttgttttatttattttttt ttttattttg tgtaggaata 13860 ttttaaagta aatttaagat attagattattttatttata aatatattag tattgggggt 13920 ttttttttta attattttgt attttttgtagagttatttt gagagagtta taaagttagg 13980 aatggtttag agtatattat agtatggtaaatgtttaaag agagagaaat aaaatgggga 14040 tattagaaag gtgatattta atggaattttagaatgtaag tagggatttt tgtgataaaa 14100 tgaaaaggat tattaatttt ataggattttttatttatgt attttagttt ttatttattt 14160 tttatttggg aaatttgttt ttttttttttttttgttttt tgtttttttt ttatgtttta 14220 ttttttggat tagttttttt taggttttgtttgttttttt tataggagtt ttttttatga 14280 aaggtatttg tagtagaaat tgttttttatgttatttatt ttttatgtat tattttagta 14340 agagtgtttt tgagatttag ttgggtatatggttatttag cgaaaggttg taatagttag 14400 ttttttttat aacgaggtgt agcgttatgattaaggtttg gaatgtaagg attgtgtttt 14460 ttatgttttt ttttttttta tttaaataaagatttatatt ttttaatttt tattgtagta 14520 agggtgttta ttaagatttg gttattaagttttggttaat gggatataag tataagtgat 14580 atagataatt tttgggttat atttttaaagggaaaggttt gttttttatt tgtttttttt 14640 ttttttttag tttgttagaa tgtggatattatagtggagg taaagttgtt attttagatg 14700 ataagaagga agttaggtga tcggggagataaaataatat attaggagtt tttagtgttt 14760 gattttgtgg agtcgttacg ttaattttggagtgttttgt ttagattttt atgtaagtaa 14820 gaaaaatatt gtattttgtt taagttattgtattgtgttt ttttgttttg tttttgttat 14880 agtagttata tgtgtgtttt tattgatagaggattaatat ttatttttgt tttttttatt 14940 tgaagttgta gattgtggtc gggagtagtggtttacgttt ataattttag tattttggga 15000 ggtcgaggcg gatagattac gaggttagtatttcgagatt agtatggtta atatggtgaa 15060 gttttatttt tattaaaaat ataaatattagttaggtatg gtggtaggtt tttgtaattt 15120 tagttattcg gtaggttgag gtaggagaattatttgaatt cgggaggtag aggttttagt 15180 gagttgagat tgtattattg tattttagtttgggcgatag attaagattt tattttaaaa 15240 aaaaaaaaaa aaaagttata gattgtaaggaaaatatttt taaggaagtt gaggatatag 15300 tagatttgga ttgtttttaa atttgtttatttttttgagt gtattgttcg gagtatttta 15360 ttgggtagta tattttggtt ttttttttagttcgatgtgg tattatattt gatttttggt 15420 taataaaata tgagaggata tgaaatttaatagtttttgg gtttggttta taaaattttt 15480 tatgtaattt tttatatttt tttattttttagttgttgag atttttttag gtattatata 15540 gaagtagttt gggtttttag tagtaaaggagagtagattt tttttattat tttgtatcga 15600 attgtgatat gagtaaaaaa taaagtttttatttttttat attattgaga tttgaggatt 15660 gttagagtag ttagtttttt tagtttaatatagtattagt agaggataat taggttagat 15720 atagtagttt atgtttataa ttatagtagtttataaggtc gaggtgggta gattatttga 15780 tgttaggagt ttgagattag tttggtcgatatggtgaaat tttagtttta taaaaaatac 15840 gaaaattagt taaatatggt ggtacgtgtttgtgatttta gttatttagg aagttgaggt 15900 aggaaaattt ttaagttagg aggcggaggttgtagtgaat taagattgta ttagtgtatt 15960 ttagtttggg taatagagtg agattttgttttaaaaataa ataaataaat aataaaaaat 16020 tttttttaga ataaaaatat atattaataatattaagaat ggttaggtac ggtggtttat 16080 attttttatt ttagtatttt gagagttttaggtgagtaga ttattttagg gtaggagttt 16140 gagattagtt tggttaatat ggggaaattttgtttttatt aaaaatataa aaattagttc 16200 gggcgtagtg gtttacgttt gtaattttagtattttggga ggtcgagatg ggcggattac 16260 gaggttagga gatcgaggtt attttggttaatacggtgaa attttatttt tattaaaaat 16320 ataaaaaaat tagttaggta tgatggcgggtatttgtaat tttagttatt cgggaggttg 16380 aggtaggaga atggcgtgaa ttcgggaggcggagtttgta gtgagtcgag atcgcgttgt 16440 tgtattttag tttgggtgat tgagggagattttgttttaa aaaaaaaaaa aagaaggtaa 16500 agtagaggtt tttttttaaa gatttttttttttatttaat taggaataaa tagtaatttt 16560 ttttagaagt aaaatttatt taaagatttgtgttaatatt tttaaatatt tgttagtttt 16620 aataaattaa tgtattttat gtttttagtttttataattt agtataaata tttgttttgg 16680 tatgtttata ttagtttaag taagtattaggttatagttt gttttttttt tttatttgaa 16740 gatgttttag tggtgggttg aagggttttttaagtgtcgt taaagtggga gtttaggtag 16800 aggaggtgtt gagagcgagc gagggttgtgaggattgtta gtaggttgtt attttttaat 16860 ttttttttta aataggatat tttaattgttgttgggaatt tggttaatga tcgttttagt 16920 tattttttgt tgtatagggg cgatgatggggttttgtagt tgtagtgttt tttagagggg 16980 aggtttttag gttagggaaa ttgttagcgggttagtttag gggttttcgg tagaagttgt 17040 tagttgaatt gatttggggg tttatttgtaagattatttg tagtttgatg gtttcgattt 17100 tagaggaaat aaatttgata ggaaggttaaaaatataggg tttaaaggcg agtaatagta 17160 agatggttgt tataggattt agaaaggggagaagttatgt tgtttaattt tagaggttgg 17220 tataagaatt tgaaaggtat ttgattttagaagttttttt ttgtaaatat taggcggtat 17280 tttatattat tttcgattgg ttagtgtaaaaataatattt tttttttaag aaggtgtaga 17340 gttttttttt tttagtagtg aggaggattaggttttggcg gttttggaga gttattgttg 17400 ttaaagagtt tatttgggat tataaagtaagaatagattt tattattttt tgtagaatgt 17460 ttgagaaatt ttttgagagt gtgtggtagtaggataatga agtagataaa tcggttattt 17520 tggtttt 17527 29 8842 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 29aattgtaata tatgttatta tgagttttaa aataattaag tgagtaattg gtagggttgt 60taatagtgtt aattaatttt ttggatgttt agttataaag atatgttaaa ataatgtttt 120ttgtatttga ttttattgtt atggggaaaa aatattttaa attattggag gaagtttttt 180tttgttttcg aaaaaaaatt atatatgaga aaaatataag gaattttaag tttggtaagg 240gtttgttttt tttttttggg aatcgtgata agttttttta tgaagtgttg attttaggta 300gatttaaata ggtggtttgt tagacggtta gattttattt atacgagggt tggcggtttt 360gagagttttt tgagttaatt gtatatatat atattttttt gagacgaagt tttattttgt 420tatttaggtt ggagtgtagt ggcgtgattt tagtttattg taatttttgt tttttgggtt 480taagtgtatt ttttttggtt tagtgtaatt cgtacggatt tagggggatt gaataaaggg 540gattgaacgt gggaataaaa gataagagat aaaataatat atttggaaga aggggttagt 600ggtattttag ttttttaaag tgttgggatt ataggcgtga gttattgttt taagttagaa 660gatagaaatt tttaagtttt gttttattag tgaggattta ggttattaag aagtgaaaag 720atttgtaata tttatttata gtttataaga ttttagtata gtgtttatta aggatggggt 780tttgttttaa gtgtttgata aatattaatt tatataagtt ttatgatagt tagttttatg 840agatgaatgt tgttattatg ttttatttaa agacgaggaa atcgaagtat agagagttta 900ggtaaattgt tcgaggttat atagttggta agtcgttgag ttaggatttg agattaggta 960gattggtgtt agagtttaga tgttaggtcg ttttttcgta ggatagtttt taggttttta 1020aaggttgttt tcgtttgggg attagttata gaaaatgatt gatagtaatt ttaggttaga 1080tttattagtg tgtgtttaaa atttttttta ttaaaatatg tattttttta tatattttta 1140ttggataata gaaagatatg atgggtcgag tgtagtggat tatgtttttg attttagtat 1200tttgtgaggt tgaggtggga ggatcgtttg agtttaggag ttcgagattt gtttgggtaa 1260tatagcgaga ttttgttttt attttaaaaa ttatatagaa agatatgttt atatttattg 1320tggtttattt attttagatt taggaatttc gtgttttttt gaatatatta tggtattttt 1380ttttattaat tttttttagg attttgttat gagagggtat agtttatttt ttatatttat 1440aaaatgtaaa gttgatatga atattttttt ttggtttttt attattttta ggaaaagtgt 1500ttaaattttt aatgaggttt aataggatta ggataattta ttgttaattt cgtgtttagc 1560gtttagatta tagttagaag gttttttttt tagtgttgag gtttgaatgt gttttttaaa 1620atttatttat tgaaatttaa tttttaatgt gagggtatta ggaagcgggg tttttgggag 1680gtgattagat gatgaggatg gagttttgtt ttattttttt aggttttttt gaatggaatt 1740agtattttga tggaagaggt tgaagggaat attttaggta attttttgtt tttttatttt 1800tttgttatgt gaggatttag ttagaaggtt tttattagat attgaatgtt ttgatcgtgg 1860attttttaat agttagaatt ataataaatt aatgtttggg tttgtttgtt tggttggttt 1920ttattgttgt tgttgtttgt tgtttttttt ttttgagata gggttttgtt ttgttatata 1980ggttggagtg tagtgatata atcgtggttt attgtagttt cgatttttcg ggtttaagtt 2040atttttttat tttagttttt taagtagttg ggattatagg tatttgttat tatgtttagt 2100taatttttgt tttttttgta gagatggggt tttattacgt ttgttaggtt ggttttaaat 2160ttttgggttt aagtaattta tttgttttag tttcggaaag tgttaagatt ataggtatga 2220gttatcgggt ttggttaaaa ttttttatat tttgtgttga gtggtgaata taattgtaaa 2280aaaaaaaaaa aattatgtaa ttgtatagtt ataaattgtg tattttatta tatgtaagtt 2340atattttatt tttttaatta gaaaataatt attttaaata tgatttgttg tgatatattt 2400ggattttaaa atgggtattt tatattcgta ggggaaaagg tgggaattaa tatttgggtt 2460ttgttgtata ataggttttg tgtgagattt aatatagaag aattagattt ttttataata 2520ttaggaaaat attaggaaaa aattattagg aaaaaaatat taggtaattt taggaattaa 2580atgtaatttt gtgatatttt ttattaggtt tttttaagag taattatttt aggtatttta 2640atggtagatg gaatttttaa ggaattttta tttttaggtg gattaatagt ttattttgaa 2700aatgatagta atgtgtattt agtttaatat gataaagtat ttttatataa atgtttgatg 2760aattttatgt taataagatt atatttgtta gtagaagggt ttaaattagg attgaaattt 2820taaatttata tgtgataatg ataagtgttt tattaatttg aaagtatatt aaataaaata 2880ataaattatt tttggagtta tagtgaattt ttttaatata tttattttaa gaatatataa 2940tttaggaaat tttagatgtt tattttatga tatttcggga gataggggat tttagaggat 3000tttcgttcgt ggcgtaaaag tattattatt tcgtggagat gatttttaaa ttaatatttt 3060tagtaagatg ttttagattt ataattttaa tttttcgggg gatattttta gatagttgtg 3120ttattgttat tattaggtta atatgtttta aattatttag attagttttt ttttttgagt 3180tggatatttg gtttttaatt tttttatttt tttttatttt ttatatttta ttagtagtag 3240tagttgttga aattatatta tgtaagtttt ttacgtttat ttttgttttt taatggcgtt 3300tttttatttt tttaagaagt ttttttttat tgtaatacga ttttttagtt tagagtttgg 3360tttagtgttt aaattatttt tttagttatg ttgagagttg gttatgtttt gaatttttgt 3420tttgaatatt tttagtgata ttgggagaga attattttat tggattattg ttattgttag 3480aaaatttatt gttatgttga aatgaaatga ttttatttat atatatatat atatatatat 3540aaaatagttt ttttttttgg aatatgattg gtttgaaaat gtgtgaagat atatttaatt 3600ttttttggtt ttattgttta tttaattttt tgtttttttt ttggtaggag gattatattt 3660tattttgtgg aatttagata tggtcgggta attagttttg gttcgtgaaa attgagagga 3720agtgatatgt gttatttttg ggtagaagtt ttgagagtcg gtttaaatga tttttttttt 3780ttttatttat gagataagtt aagttttaga gagagggtgt tacgttgtga gggatttgtg 3840ttacgagtac gatggttcgc gttattttaa atttttgaaa ttattgaaat ttggaggtta 3900gttgttatat tataatttag ttaattttag ttagtttgtt ttttttttaa tttttttaat 3960cgttttttat aagttataat cgtagttttt tatcgttttg attattgttt ttggatttta 4020tttagtttat ttattatttt ttttaaaatg tggagtttaa atttgaattc ggaattttag 4080gtgtaatttt attaggatat aatataatgg gtttttgagt tttttgattt tttgaataga 4140gttttttgtt gttttggtgt tttgtttttg tgtgtgtttt tattatcggt tgagttacgt 4200tgttaattcg tagtgagttt gtgaattaat aattagagaa aaaagatttt ttttattgtt 4260ttttcgatat atattgggaa ataaattttt tgattcgcgt ttaagtagat agggtagaat 4320tgtttaattg ttacgtgatt ttttaaagat aaagttagtg gtagattatt tatagaaatt 4380agatgttttg ttttttggtt ttgagtatgt tgttaatttt tattatttag tgtattgaac 4440gagatgtatt gaacgagggt tgtagagttg tagtatcggt aggagtaggc gttcggtagg 4500acggggtttg tataattttt tcggtagtta gtagagcgga atttaggaag gttttttttt 4560cgcggcgttt tggaggcggg ggttttattt ttttacgtag gcgttattaa gtttcgtttt 4620tttattcgtt cgcggcgtgg cgtcggaaag agtttttagt tttttttttt ttggcgttga 4680tatttaatgg gtagttttag gtttttagcg ggggcggggt attttttgga cgtcgttttg 4740gttggttcgc ggttcggcgt agcgtatgac gttattacga ttttgttacg tcgcggtgcg 4800attgaggcgt ggcgtttgtt ggggtatttg aaggagattt gggggtattc gcgtcgtgtt 4860ttttgggttg tgaggagtcg tcgttgtcgt tattgtttgt gttttatgag gaagatgttc 4920gtcgtcgttt ttcgcgtgtt gtttggcgtt ttttagaagt cggtgagatt tttcgggcgg 4980gtcgggatgg ggcgcgagtg gggttgaggc ggggtcggag ggtagggcgg gttaggtcgg 5040gttatttaga gcggggtgga aggcgttagg ggagtcgggg agtttttatt tcgttttcgc 5100gttttgtatt tcgtttttgg tttcgggaga agcggtacgg atcgggatta cgttaaggtt 5160cgtgtgaatt tttttttttt cgatatttat ttttcgtttt cgggtttagt tgtgcgttag 5220gcgaagtcgg tgtgtttaag aggtgtttgt tgggttatag gatacggaaa gggtggtttc 5280ggtttttttc gagtttttaa ttgattttat ttatttcgga ttttttaatt taattttttt 5340tgatcgagag gttttgtaat agcgtagaat ttggagatag ggtggtttcg tttaaatagt 5400atttttatta ttgattagtt ttgtgatttt gagtaagttt ttaaacgttt cggggattcg 5460gttttttaaa atgtttgttc gaagtggagt taatttttaa atggagataa gagttatttt 5520tgaaatgtta ttagttaatt ttaaaatgga gataataaga gtttttattt tttggggttg 5580ttttgaggat ttaacgagtg atacgtgtgg aaacgatttt aaatagtatt tggtatataa 5640tcgataatat gtgtgttgaa tagtgttatt tattgagttt ttagttcggt atatattttt 5700tgaatatttg tgtttagttt tgaggcgggt ttatagaagg ttagtttttt tagaaataaa 5760tttttttttt tttttttttt tttaatattt gagttttttt tggtagtgag tttaggagcg 5820tcgaagtaga atttagatta ttttttttgg tntattntcg ttttgtttga gatagggttt 5880ttgtgttatt taggttggag tgtagtagta ggatagttta ttgtagtttt agtttgttgg 5940gtttaagcga tttttttgtt ttagtttttt gagtagttgg gaatataggt atgtgttatt 6000attatattta gttaattaaa aaaatttttt ttttattaga gatatggttt tgttacgttg 6060tttagtttgg tttttatttt taggtttaag tagttttttt atttcggttt tttaaagtgt 6120tgggattatt tttatttttt taaaattagg taggtaggga gatttatttt aggtttaaag 6180attgttattg ttttattaaa gagtgtttgg tgtgaaattt tgaaatgaat attaagattg 6240tgtttttatt tttgaataag gtttatagtt tttatagttt ttattttatg gaagaagatt 6300gaatgtattt aaaatgttat tttattgttt gtatttttgt atggtttttt ttgtgagatt 6360tttattagta atgttttggt tttataagtg gtaggtaaga gttttaattt atattgttag 6420aatttggaat ttttgaaacg tttttttttt tttatatgaa tggtttttat gtatttagga 6480agttaaagtt ttattttttt ttaattaatt ttttttttta ggttggaatg tagtggtata 6540gttatagttt attgtagttt taggtgtgtg ttattatatt tgattaattt tttaatattt 6600atttttgtag agatgagagt tttatgttgt ttaggttggt tttgaatttt tggttttaag 6660tggttttttt attttggttt tttaaagtgt tggggattat aggtgtgagt tattatgttc 6720ggtttagttt ttatttttta aaatttgagt gggttgttcg tggtttttgt tagagaggaa 6780ttttatttaa tagagaattt ttttatggtt ttttagagaa aatgaatggt aaatttattt 6840ttttaataag tttttattta gaaatgatat atatatattt ttgataggat ttttagtttt 6900tttaattttg ttttttttat ttatattagt ggtttttatt tttgagatat atagtaatga 6960agttatggga gaaagtattt aagtagtttt ttggtagttt taatttttgt aggcgtaaga 7020ttataggcgt atgttatagt attgggtttt tttttgtttt ttattgtata gtattatttt 7080gttttattgt tttaatttta ggattgagaa agaagttatt ttttttttgt tattgtcgtt 7140tggttggttt ggatttttgt tttttaaaaa ttgtagtttt tgtagttgta tttggaaatt 7200tattttataa tataataaat ttttggtttt ataaaatatt tattaattgt taagaataat 7260atatttgttt gattgttaaa tataattatt gatttgttgt tttatttttt tttagtttta 7320ttttttttta aatttttaaa ttttttttat tttttttgag atatattagt ggattgtttt 7380tgtttgtaag ttaattgaaa tattgatttt tagtatttta gttgtttttt tttagtattg 7440ttattgtttg tgtttgttgg ttttgtttaa taatggttta ttgaggggtg aagatatacg 7500taattagttt tttgtttatt ggtttgtata ttttagggta tatttggtag attagtttta 7560atttttttta ttaagattag tttagtgttg gattaggtaa ggtatgaata tattagatgt 7620gttttttatg gagaaattat gttggtttat acgttagtgt gtgagaatgt ggtagaaggg 7680agttaaaata gtatgataat attattggat aaattttgtg gtttaattta aattttagtt 7740attatataga atatttttgt tgtgagtagg tttgtttagt tgtaaaattg gaaaggaatt 7800attttttatt tttcgttttt aagtttttta tttttaaata gtgatagtta tttaaatatt 7860aagagaatag tgttttagag aatattttta ttggggtttt aggaggagtt tgtttaagat 7920ttaggttgtt taaattataa attataaaat agttggttta agtttattgt gtttaagtta 7980gagagtgtta agtatttttt tttttgtttt gtttttttaa agtatttatt ttatatttta 8040attaatttaa aatatttttt tttatagatt ttatttgata gaagagttac gtttgtttag 8100agtggagatt aggttatagt tttatttgaa gtataatttt ggtttgttta aaatgaatag 8160tatttggtta tgattaagaa tggtatgaaa aggttagacg tagtggttta tgtttgtaat 8220tttagtattt tgggaggtta aggtaggtgg attatttgag gttaggagtt ggagattagg 8280ttggttaata tggtgaaatt ttatttttat taaaaatata aaaattagtc gggcgtggtg 8340gtgggtattt gtaattttag ttattcggga gattgagata ggagaaatta tttgaattcg 8400ggaagcggag gttgtagtga gtcgagatcg tattattgta ttttagtttg ggtgataaaa 8460gtaaaatttc gttttaaaat aaataaataa aagaatggta taaatagata tagtttatag 8520atgatttagt ttttttagtt attaatttta ttatattttt attataattt ttttgaaaat 8580aaaggatggg tttgtttttt gttttttttt gcgttgtttg tttttagatg cgggataatt 8640ttgttttatt ggttaaagta tggatttatt ttggaggtta aggaagatgt aaatatagtg 8700tatagggtgg aagagaagtt tatgaatatg ttggggttta ttaaattttt ataattttat 8760tttgataatt gattattata ttttttaaaa tagttgataa ttaaaaagta ttgatttgtt 8820tgtatatttt tgttttttaa gg 8842 30 8842 DNA Artificial Sequence chemicallytreated genomic DNA (Homo sapiens) 30 ttttaaaaga taaaaatata taaataaattagtatttttt aattgttagt tattttggaa 60 agtataataa ttagttatta gaatgaagttatggaaattt aataagtttt aatatattta 120 taggtttttt ttttattttg tgtattgtgtttgtattttt tttggttttt aaaatgaatt 180 tatgttttgg ttaatgaaat aggattatttcgtatttgaa ggtaagtagc gtaaagaggg 240 gtaaaaaata aatttatttt ttgtttttaaagaaattata gtgagaatat aatgaaatta 300 gtggttaaag agattagatt atttgtgagttgtgtttgtt tatgttattt ttttgtttgt 360 ttgttttgag acggagtttt gtttttattatttaggttgg agtgtagtgg tgcgatttcg 420 gtttattgta attttcgttt ttcgggtttaagtgattttt tttgttttag tttttcgagt 480 agttgggatt ataggtgttt attattacgttcggttaatt tttatatttt tagtagagat 540 ggggttttat tatgttggtt agtttggtttttaatttttg attttaggtg atttatttgt 600 tttggttttt taaagtattg ggattgtaggtatgagttat tgcgtttggt ttttttatgt 660 tatttttagt tataattaga tattgtttattttgagtaag ttaaaattat attttaaata 720 aaattatgat ttaattttta ttttaggtaaacgtgatttt tttattaaat aggatttgta 780 agagaagata ttttaaattg attgaagtatgagataaata ttttagggag ataagataaa 840 agaaaagata tttagtattt tttgatttaaatataatggg tttgagttag ttgttttata 900 atttataatt tgaatagttt aaattttggataggtttttt ttgaagtttt agtagaaatg 960 ttttttgaaa tattgttttt ttgatgtttgggtggttgtt attgtttgga ggtaaaaagt 1020 ttggaggcgg ggggtgagaa atgatttttttttagtttta taattgagta aatttgttta 1080 tagtaaaagt attttatgta atggttaaggtttaggttag attataaaat ttatttagta 1140 gtattattat attattttag tttttttttgttatattttt atatattgac gtgtaaatta 1200 atatgatttt tttataaaaa gtatatttgatgtgtttata ttttatttaa tttagtattg 1260 gattgatttt ggtgagaaga gttaagattgatttgttaag tatattttgg agtgtataag 1320 ttaataggta gaaagttaat tacgtatatttttatttttt aatagattat tattggataa 1380 agttaataaa tatagataat gatagtgttggaggaaaata attgaaatat taggaattag 1440 tgttttagtt aatttatagg tagagatagtttattaatgt attttagaaa aagtgaagga 1500 aatttaggaa tttgggaaga agtaaagttgagagaaggtg aaatagtaaa ttaatggtta 1560 tatttagtaa ttaaatagat gtgttatttttggtagttaa taaatatttt gtggggttag 1620 aaatttattg tattgtgaaa taaatttttaaatataatta tagaaattgt agtttttgga 1680 aggtaggagt ttaaattagt taggcgatagtaatagagaa aaggtaattt tttttttaat 1740 tttagagttg aaataatgag gtaggataatgttatataat aaagagtaag aaggggttta 1800 gtgttgtggt atgcgtttgt aattttgcgtttgtaaagat taggattgtt agaaagttat 1860 ttagatattt ttttttatgg ttttattattgtgtatttta aaaataagaa ttattgatat 1920 gagtgaaagg aataaagtta aagaagttaaaagttttatt agaagtgtgt gtgtattatt 1980 tttgagtgag agtttgttga aaagataagtttattattta ttttttttgg agagttataa 2040 aaagattttt tgttaaatgg gatttttttttgatagagat tacgaataat ttatttaaat 2100 tttaaaaaat aaaaattagg tcgggtatgatggtttatat ttataatttt tagtattttg 2160 ggaggttagg gtgggaggat tatttgaagttaggagttta aagttagttt gggtaatatg 2220 agatttttat ttttataaaa ataaatattaaaaaattagt taggtatggt ggtatatatt 2280 tgaggttata gtgagttatg attgtgttattgtattttag tttaaaaaaa aaaattaatt 2340 aaaaaaaagt aaaattttaa ttttttaaatatataggaat tatttatgtg aaagaggaaa 2400 aacgttttaa aaattttaga ttttaatagtgtaaattaaa atttttattt attatttata 2460 aagttaaaat attgttagta aagattttataaaaggagtt atatagaaat gtaaataata 2520 aaataatatt ttaaatgtat ttaatttttttttatgaaat aagaattatg aaaattataa 2580 attttattta aaaataaaaa tataattttgatatttattt taaagtttta tattaaatat 2640 tttttgatga gataatggta atttttaagtttgagataaa tttttttatt tgtttggttt 2700 taagagagtg agagtaattt tagtattttgggaggtcgag gtgggaggat tgtttgagtt 2760 tggagatgga gattagattg ggtaacgtagtaagattatg tttttagtaa aaaaaaaatt 2820 tttttaattg gttgggtgtg gtggtggtatatgtttgtgt ttttagttat ttaggaggtt 2880 aaggtaggag gatcgtttga gtttagtaggttaaggttgt agtgagttgt tttgttattg 2940 tattttagtt tgggtgatat agagattttgttttaaataa aacganagta nattagggag 3000 aataatttga gttttgtttc ggcgtttttgaatttattgt taagaaaagt ttagatgttg 3060 agggagaggg aagaggagga agtttgtttttgaagaggtt gattttttgt gaattcgttt 3120 tagaattgag tataggtgtt taagaaatgtatatcgaatt ggagatttaa taaataatat 3180 tatttaatat atatgttatc gattatgtgttaggtgttat ttggaatcgt ttttatacgt 3240 gttattcgtt gaatttttaa gataattttaagaggtgggg atttttatta tttttatttt 3300 agagttaatt gataatattt tagagataatttttattttt atttagagat taattttatt 3360 tcgagtaaat attttaggaa atcgggttttcgggacgttt aaaaatttgt ttaaggttat 3420 agggttagtt aatggtgagg gtgttgtttgaacgaagtta ttttgttttt agattttacg 3480 ttattataaa gtttttcggt taagagaaattaagttagaa gattcgaaat gagtggggtt 3540 aattggagat tcgaaggagg tcgaggttatttttttcgtg ttttgtaatt taataggtat 3600 tttttgagta tatcgatttc gtttggcgtatagttgggtt cgggggcggg aggtgggtgt 3660 cgagaagggg gaagtttata cggattttggcgtgatttcg gttcgtgtcg tttttttcga 3720 ggttaggaac ggaatgtagg gcgcggaggcgaagtaaagg tttttcggtt tttttggcgt 3780 tttttatttc gttttgggtg gttcggtttggttcgttttg tttttcggtt tcgttttagt 3840 tttattcgcg ttttatttcg gttcgttcgggaggttttat cggtttttga gaagcgttag 3900 atagtacgcg ggagacggcg gcgagtattttttttatgaa gtataggtag tggcggtagc 3960 ggcgattttt tataatttag gaggtacgacgcgggtgttt ttaagttttt tttaggtgtt 4020 ttagtagacg ttacgtttta gtcgtatcgcggcgtgatag agtcgtaata acgttatgcg 4080 ttgcgtcggg tcgcgggtta attagaacggcgtttagggg gtgtttcgtt ttcgttaaag 4140 gtttgaggtt gtttattggg tattagcgttagagagggag gggttgaggg tttttttcga 4200 cgttacgtcg cgggcgggtg aggaggcggggtttgatagc gtttgcgtgg gaaggtgggg 4260 ttttcgtttt tagggcgtcg cgggaaaggagtttttttag atttcgtttt gttgattatc 4320 ggggaggttg tgtaggtttc gttttatcgagcgtttattt ttgtcggtgt tgtagttttg 4380 tagttttcgt ttagtatatt tcgtttagtatattagatga tgaagattag tagtatgttt 4440 agagttaaaa gatagaatat ttggtttttgtaaatggttt gttattaatt ttgtttttaa 4500 aagattacgt agtagttgga tagttttgttttgtttattt gaacgcggat taaaaaattt 4560 gttttttaat atatgtcgag aggataatgggaaaaatttt ttttttttag ttattggttt 4620 ataggtttat tgcgagttaa tagcgtggtttagtcgatga taaaagtata tatagagata 4680 aaatattaaa gtaataaggg gttttatttagaggattaaa gggtttagga atttattgtg 4740 ttgtgtttta gtgggattgt atttggggtttcgggtttag atttgggttt tatattttaa 4800 gggggataat gagtaaattg agtggaatttagggatagtg gttagaacgg tgaggggttg 4860 cgattgtgat ttatgaagaa cgattaaagaagttaggaag aaaataggtt aattagaatt 4920 ggttgggtta tgatgtaata attgatttttaaattttagt gattttaaga atttgaagtg 4980 acgcgagtta tcgtattcgt aatataggttttttatagcg tggtattttt tttttggaat 5040 ttagtttgtt ttatggatga agagaaaagggattatttaa atcggttttt aaagtttttg 5100 tttagaagtg atatatgtta tttttttttaatttttacgg attagagtta gttattcgat 5160 tatgtttgag ttttataagg tgaaatataatttttttgtt aggaggagaa tagaaaattg 5220 gatgaatagt aaaattagag aggattggatatgtttttat atatttttag gttagttatg 5280 ttttaggagg aagagttatt ttgtgtgtgtgtgtgtgtgt gtgtgaataa aattatttta 5340 ttttagtata ataatgaatt ttttaataatgataatggtt taatgagata attttttttt 5400 agtgttattg aaagtattta aagtagaagtttaaagtatg attagttttt agtatagtta 5460 gagaaataat ttgggtattg ggttagattttggattgaga gatcgtgttg tagtggaaga 5520 aaatttttta aaggagtgag agggcgttattaaaaggtag agatggacgt gagaaatttg 5580 tatggtatga ttttagtagt tgttgttgttgatagaatat gaaaggtaaa agagaatgaa 5640 aaggttggag gttagatgtt tagtttaggagaaaaagttg gtttgaatgg tttgggatat 5700 gttgatttgg tggtggtagt ggtatagttatttgaagatg tttttcggga agttggagtt 5760 gtaagtttgg aatattttgt taaaaatattaatttgggag ttatttttac ggggtggtga 5820 tatttttacg ttacggacgg ggattttttagagtttttta tttttcgggg tgttataaaa 5880 tgaatatttg ggattttttg gattgtatatttttgaaata agtatattaa aaagatttat 5940 tgtggtttta aggataattt attattttgtttggtgtgtt tttaagttga tggaatattt 6000 attattgtta tatgtaaatt taggattttaattttgattt aagttttttt attggtaaat 6060 ataattttgt tgatatgaaa tttattaaatatttatatag aaatgtttta ttatgttaaa 6120 ttggatgtat attattgtta tttttaaggtgaattattag tttatttaga aatgaaaatt 6180 ttttaaaagt tttatttgtt attaaaatgtttgaaatggt tgtttttgaa agggtttgat 6240 aagaaatgtt atagaattat atttggtttttaggattatt tagtattttt tttttagtaa 6300 ttttttttta atattttttt agtattatggaaaagtttaa tttttttatg ttaagtttta 6360 tatagagttt gttatatagt aggatttaaatattaatttt tatttttttt tttgcgggtg 6420 taaaatattt attttaaggt ttaaatgtgttatagtaggt tatatttggg gtaattgttt 6480 tttgattaaa aaaatgagat ataatttatatataataaaa tgtatagttt gtagttatgt 6540 agttatatga tttttttttt tttttataattgtatttatt atttagtata agatatagaa 6600 aattttggtt aggttcggtg gtttatatttgtaattttag tatttttcga ggttgaggta 6660 ggtggattgt ttgagtttag gaatttgagattaatttagt aaacgtggtg aaattttatt 6720 tttataaaaa agataaaaat tagttgggtatagtggtagg tgtttgtaat tttagttatt 6780 tgggaggttg agatgggagg atggtttgaattcgggaggt cgaagttgta gtgagttacg 6840 attgtgttat tgtattttag tttgtgtggtaaagtaagat tttgttttaa aaaaaaaaaa 6900 taataaataa taataataat aaaaattaattaaataaata aatttagata ttgatttatt 6960 atggttttgg ttgttgggaa gtttacggttagggtattta gtgtttggtg agggtttttt 7020 ggttgagttt ttatatggta gaagagtggaagggtaaaaa attgtttggg gtgttttttt 7080 taattttttt tattagggtg ttaattttatttaaaggggt ttgggggagt ggggtagagt 7140 tttattttta ttatttaatt attttttaaaggtttcgttt tttgatattt ttatattgga 7200 ggttaagttt tagtagatga attttagggggtatatttag attttagtat tgaggaggag 7260 attttttagt tgtggtttga gcgttgagtacgaggttggt aatagattgt tttggttttg 7320 ttagatttta ttaaagattt agatattttttttaagaata atgggaagtt agagaaggat 7380 gtttatgtta gttttgtatt ttgtaaatatggaagatgag ttgtgttttt ttatgatagg 7440 attttaaagg aaattaatgg aaggaggtgttatagtgtgt ttaggagagt acggggtttt 7500 tgaatttaag ataggtgaat tatagtgagtatgagtatat ttttttatat gatttttaaa 7560 atagagatag ggtttcgtta tgttgtttaggtaagtttcg aatttttggg tttaagcgat 7620 ttttttattt taattttata aagtgttgaaattaaaggta tgatttattg tattcggttt 7680 attatgtttt tttattattt aatggagatatgtggaaaaa tatatatttt aatagggaag 7740 attttaggta tatattgatg agtttggtttgaagttatta ttaattattt tttgtggttg 7800 atttttaaac ggaagtagtt tttggaaatttaagaattgt tttacggaga ggcggtttag 7860 tatttggatt ttggtattag tttgtttggttttaaatttt ggtttaacga tttattagtt 7920 gtgtgatttc gggtaatttg tttaaattttttgtgtttcg gttttttcgt ttttaaatgg 7980 agtataatga taatatttat tttatagggttggttgttat aaagtttata tggattaata 8040 tttgttaggt atttaagata gagttttatttttaatgagt attatattag aattttgtag 8100 attataagta aatattgtaa atttttttattttttggtga tttgggtttt tattggtaaa 8160 gtaaagttta gaaattttta ttttttggtttggagtagtg gtttacgttt gtaattttag 8220 tattttggga agttgaggtg ttattgatttttttttttaa atgtattatt ttgttttttg 8280 ttttttattt ttacgtttag ttttttttgtttagtttttt taggttcgtg cgggttatat 8340 tgagttaggg agggtatatt tgaatttaggaggtagaggt tgtagtgagt tgagattacg 8400 ttattgtatt ttagtttggg tgatagagtgagatttcgtt ttaaaaaaat atatatatat 8460 gtagttggtt taaaagattt ttagggtcgttagttttcgt gtgaatagag tttaatcgtt 8520 tgataagtta tttgtttggg tttgtttgggattaatattt tatgaagaag tttgttacgg 8580 tttttagaag gagagaatag gtttttgttaagtttaaggt tttttatgtt ttttttatgt 8640 ataatttttt ttcggggata gggggggattttttttagtg gtttaaggta tttttttttt 8700 ataatagtaa agttaaatat aggagatattgttttaatat atttttgtga ttgggtattt 8760 agaaaattgg ttaatattgt taatagttttgttaattgtt tatttgattg ttttgaggtt 8820 tatggtagta tgtattgtag tt 8842 316033 DNA Artificial Sequence chemically treated genomic DNA (Homosapiens) 31 atatatattt ttaatgtatt tggataaata ttaaggagtt tgattgttagatagtgtggt 60 gagattatgt ttagttttgt aaaaaattgt tatattgttt tttaaagtggttgtattgtt 120 tcgtattttt attggtaatg aatgagagtt tgttgcgtta tattttcgttcgtatttgat 180 gttgttaatg ttttggattt tagttattta atagttgtgt agtagtatttttttgtttta 240 atttgtaatt ttttcgatag tatatgatgt taaatatttt tttatatgtttatttgttat 300 atgtgtattg tttttgatga agggtttatt tagatttttt gtttatttttatttatttat 360 ttatttattt atttatttat ttttgggata gtattttatt tttgtcgtttaggttatagt 420 gtaatggcgt gtttttggtt tattgtaatt tttatttttt aggttttagtgatttttttg 480 tattagtttt ttaagtagtt gggattatag gtgtttgtta ttatgtatggttaatttttt 540 gtatttttat taaagatagg gttttattat gttggttagg ttggttttaaatttttgatt 600 ttaggtgatt tatttgtatc ggttttttaa agtgttggga ttttaggcgtgagttatcgc 660 gttttgttgt gtttttaaag tgaggtgttt ttttattatt tagttttaagagttttttgt 720 gtattttgga tattagtttt ttattagata tgtattttgt aaagatttttttttagtttg 780 tggtttgttt ttttattgtt ttaatattgt ttttgtagat tagaaggttttaattttaat 840 gaaggttaat ttggtaatta ttttttttat agataatgtt tttgttgttgtatttaaaaa 900 gttattggta gatttttttt tatgttattt tttaagtatt ttataggtttgtgttttata 960 tttaggttta tgatttgttt tgagttaatt gttgtgtaag atgttaaagtttgtgtttag 1020 atttattttt tgtatgtggc ggtttaggtt tagttgtttt aggattatttgttgaggaga 1080 ttattttgtt tttattgatt tgttttagtt attttggatt agttatttgtgtgggtttag 1140 gttattgttt gggtttcgat gtttgtgttt tttagatttt atgttgaaatttgattttta 1200 atgttgaagg tggaatttaa tgggaggtat ttggtttacg ggtgtggattttttatgaaa 1260 tgtttttttt gggggtaggt gggacgggga gatgaatttt tattttattagatgatttcg 1320 gagttggtta tttaaaggaa tcgggttttt tttttttttt ttttttgtttatatttttgt 1380 tatgtgattt ttgtatatac gtatattttt ttttattttt tgttatgagtggaagtagtt 1440 tgaggttttt tttatatgta gatgtttaat tttgaatttt ttagttattagaattgtgag 1500 ttaaataaat tatttttttt ttataaatta tttagattcg agtattttattatagtaata 1560 taaaataaat taagtttatt tttgagtttt atattttgtt tatttttatatatatttttt 1620 atttttatta tgaagttcgt atgtatttag taggtagtaa aatttttatttcgaaaatga 1680 ggaaattgag gtatagagtg agtagggttt ttttttttag gttagtagttggttagaatt 1740 gaaatttata tttgtttggt tttgattttg tgtatttttt ttgtttttaaggtgtttaat 1800 ggtgttagaa agagatttag tatgttaatt ttaattttag atgttgttttttagggttta 1860 aattgtagta tttttttttt ttaatggttg ttggaatttt gggtagttgttttttgattg 1920 taattaaggt tgtttgttat ttacggtttt tttgaatttg taatgtgagttttgatttgt 1980 ttaaaaattg gttttgttta aaatatgtag ttttttttat tagtattttttaatgttttg 2040 ttgagatttt gtgcgtaatt attttttttt tggtttatat tgaattttttttgttgagaa 2100 gttatttgtt tatggggttt gttttatcgt ttttttgaag ataggattttgttgagtggg 2160 attgttaaac ggagtatagt gttaaaaatt ttttgggtta aatgttattatatttttatt 2220 agggtttgga gtatttgttt ttagaattta taaatattaa tttatgttggcgttttgtgt 2280 tgtttaagga gagtattttt ataatttatg aaattttatt ttattgttagaagttagtaa 2340 agagaaaaag aaagaaagag aggtagaaag agaaaatttt atagttatattttaaatatt 2400 aagggataga tttttttttt aagaatataa gatttataag ttttaaataggagtgaaata 2460 gtttgtagaa gtttttatag taaatgaatt ggtagagttt agatttaaattttgatttgg 2520 tgttaagggt aaagtaggtg gtttttaatt ttattaggtt tttttttgtgagaaggggat 2580 atgtttattg tggttttagt agatagagta ggttgcgtgg gatttgggagattttttgtg 2640 aatggaaggt attattttat tattgtgtaa ttgaattaag atatattgttttatttattt 2700 tttattgatt tttattatta tttttttgag acggagtttc gttttgttattaggttgggg 2760 cgtagtggtg cgattttggt ttattgtaat cgtcgttttt tgggtttaagcgattttttt 2820 gttttagttt ttcgagtagt tgggattata ggcgtgcgtt attacgtttagattattttt 2880 gtatttttag tagagacggg gttttattat gttggttagg atggtgttaatttgttgatt 2940 ttatgatttg tttgttttgt ttttttaaag tgttggatta taggcgtgagttatcgtgat 3000 aggttagatt tgttgtttta aaataaagta tatatggtgg tttattatgatgttaagtat 3060 tgtttaaagt atattataaa gttgggtagg atggtgttcg tttatatttttagttattgg 3120 ggaagttaaa gtgaggcgat cgtttgagtt taggagttta aggttgtagtgagttatgat 3180 gttgttattg tattttaatt tggtgataga gtgagattta ttttttaaaataaagataaa 3240 aatatatttt ataattgtta agttatttgt atgtgtttat taaaattttttttggggatt 3300 ttttttggtt tatttttgta gtttcgatgt taggggaggt tgaggtaaaatgatcgttag 3360 atagttggta tttgaggtta gtttatgtaa tatattaaaa attcgtgtttatatgtagaa 3420 aaaatattaa ttaggcgtga tgatataagt ttgtagtttt atttgtttgggaggttgagg 3480 taggaggatg gtttgagttt gggaatttga agttttagtg agttatgattgtatcgttgt 3540 attttagttt gggtgataga gtgagatttt tgtttttaaa aaataaataaatgataatag 3600 taataataat agaatatttt ttttgaagtt agtattatgt agttatgtattttataaatt 3660 gttagtttaa ttttaaggga atagtttagt agttgatatt tgagaaggatttgtagaaag 3720 gatttaaaga ttacggatat cgtttattgt ttttttgttt ttttataagatagaagaagg 3780 atggtattat taatttatgt tttgtttatt tattttaagt tttagattattggattttta 3840 aagattatga ttttcgtttg gtttttggta taaaaggaga taaggagggagtttaaaagg 3900 tgagtacggt gtgatttagg attgaagttt ttgttatttt ttggggggtaattgtaaaag 3960 tgagtcgttt tgattagtcg tttgtgtatt tgttattgtt aagggggtataggtagattt 4020 aagttttggg gtttttttga taattggtaa ggataaggta ttagtaagggtaaaggaata 4080 gtaataaaat aatttaataa taaagatatg aagatttata ataatttttaggtcggtgta 4140 gtgttttagg attgtaattt tagggcgttt tgggaggttt aggcgggaggatcgtttgag 4200 gttaggattt cgaggttaag gtgaattgcg ttttagtttg ggtaatagagtaatattttg 4260 tttttaaaat gaaaagaaaa tagtttaaat tttttaagtg tatattaaattttttatttt 4320 ggagaaggaa aattggtttc gagtttcgtg tgagtttttt ggggttcgtcgggagggggt 4380 tggtacggtc ggatttgtag tattagtttt ggttagggcg ttgtgggatttgtaggggat 4440 tataggatgt tgtggcgcgg tgcgtttaga ttggcggaga aacggttatacgtttacgga 4500 gttattgaga aggcgagcgg aggcgtagtt cgttcgttcg tcgcgggaattttaggttgg 4560 ggcgttgggc gcgcgaagat ttagtcgttt cgtttattaa gggcgcgtcggttttcggtc 4620 gtagtttttg ggttggtagt cgtcgtcgcg tcgcgttttt attggtgttcggcggtgacg 4680 cggtcgagcg ggtcggggtt gtttggttcg ggggcgggcg tggggcgcggggcgcggagc 4740 gcgaggggcg ggggtcgggc gtattgttga tgaaatttgg cgtcggaattcgttagtttt 4800 cggcgtttat ttagttcgcg taggtaggtg tgagtagcgg gttaattatttggtaggcgc 4860 gtacgcggtc gcgggttttc gttaatcgta gtttttattt tttttttcgcgcgtcgcgtt 4920 ttcgtttcgt ttcgtttcgt tcggtttcgt cggtcgagcg ttcgttggtttttgagcgcg 4980 ttcgatagtt tgtttgttcg cgattttgtc ggagtttttt cgtcgtcggtttggtgagtg 5040 ttcggtttcg ttaacgtagg gggtagtttt ttgggttcgg gttattacggagggggtttt 5100 ggcgtcgcgt ggggtcgcgg tagggcggcg cgggagtggc gagggttttcgcgtcgggaa 5160 cgttgttatt ttttgggaag ggttaggatt agggtcgggc gggtttcggagtgggcgagc 5220 ggggttggtg tttatgcgat tgtcgttttt acggagttta ttttggttttttgaaatcgc 5280 ggcgtggtgt atgatgtaat atcgagtgag taagcgtggg cgatttggcgatgttcgttt 5340 cgcgcgtttg ttcggggatt cgcgcgtcgt tacgtacggg gtggtcggggtgcgtaggcg 5400 ggcggcgggt acgggggtta gattgggagg tatacggagt tcgtcggcggcgaggagatt 5460 tttttttata tggcgcggtg tagagtattt cgtttcgtta cgaggttcggggatgtgtta 5520 ttagtcgtgg gtggggattt tgttcggtcg ttcggagggt ggtttcgcggtaggtggtcg 5580 gtttagggat tttgttgtta ttttcgttcg gtggtcgttt tgatttagggcgtttggttt 5640 ttcgtttgtt tttagaattc gggacgcgtc gtttgtattt ttcgtttgggtttttaagat 5700 tgttttgagg aagttttttt taggtgggtt tttttgtgat ttagtgtggtttggaaaggt 5760 cgggtttttt aagtttttta tatggtttgg aatgagagga agttttttcgtttttagtaa 5820 gatatcgtat ttttagggtg tttttttttg cgtagtagaa aattttttaggtatgggtag 5880 gttagagtta ttttaaaatt tgcgcgtata tagagcggta gttgtattgtagtattataa 5940 tagtttgttg gtttagtttt tgattttttt taggggatgg gggaattagatagtagttgt 6000 gtttgatttg tgtgattagg atagttagat atg 6033 32 6033 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 32tatgtttgat tattttagtt atataagtta aatataattg ttgtttggtt tttttatttt 60ttggaaaggg ttaggagttg aattagtagg ttgttgtagt attatagtgt agttgtcgtt 120ttgtgtacgc gtaggtttta gaatgatttt gatttgttta tgtttgggaa gttttttatt 180acgtagaaag gaatattttg agaatacggt gttttgttaa aggcggaaga attttttttt 240attttaaatt atgtggaggg tttgaggaat tcggtttttt taggttatat tgggttataa 300ggaagtttat ttaggggaga tttttttaaa gtaattttgg ggatttagac gagaggtgta 360ggcggcgcgt ttcgggtttt agggataagc ggagagttag gcgttttagg ttagggcggt 420tatcgggcgg ggatggtagt agagtttttg ggtcggttat ttgtcgcggg attatttttc 480gggcggtcgg gtagagtttt tatttacggt tgatgatata ttttcggatt tcgtggcggg 540gcggggtgtt ttgtatcgcg ttatgtaagg gaaggttttt tcgtcgtcgg cgggtttcgt 600gtgtttttta gtttggtttt cgtgttcgtc gttcgtttac gtatttcgat tatttcgtgc 660gtagcggcgc gcgggttttc ggataggcgc gcggagcggg tatcgttaga tcgtttacgt 720ttatttattc ggtgttgtat tatgtattac gtcgcggttt tagggagtta aaatggattt 780cgtggaggcg atagtcgtat gggtattagt ttcgttcgtt tatttcgggg ttcgttcggt 840tttggttttg gtttttttta gaggatggta gcgttttcgg cgcgggggtt ttcgttattt 900tcgcgtcgtt ttgtcgcggt tttacgcggc gttagggttt ttttcgtgat gattcgggtt 960taaggagttg ttttttgcgt tggcggggtc gggtatttat taagtcggcg gcgggggggt 1020ttcggtagga tcgcgaatag atagattgtc ggacgcgttt aaggattaac ggacgttcgg 1080tcggcgagat cgggcggggc ggggcggggc gggggcgcgg cgcgcgggga gaggagtgga 1140ggttgcggtt agcgggagtt cgcggtcgcg tgcgcgtttg ttaggtagtt gattcgttgt 1200ttatatttgt ttgcgcggat tgaatgggcg tcgagggttg gcgggtttcg gcgttaggtt 1260ttattagtag tgcgttcggt tttcgttttt cgcgtttcgc gtttcgcgtt ttacgttcgt 1320tttcggatta ggtagtttcg gttcgttcgg tcgcgttatc gtcgggtatt aatgggagcg 1380cggcgcggcg gcggttgtta gtttagaggt tgcggtcggg gatcgacgcg tttttggtgg 1440gcggggcggt tgagttttcg cgcgtttagc gttttaattt ggggttttcg cggcgggcgg 1500gcgggttgcg ttttcgttcg tttttttagt agtttcgtag gcgtgtggtc gttttttcgt 1560taatttgagc gtatcgcgtt atagtatttt gtggtttttt gtagatttta tagcgttttg 1620gttagaatta gtgttgtagg ttcggtcgtg ttaatttttt ttcggcgggt tttagggagt 1680ttatacggaa ttcgagatta gttttttttt tttaaaataa aagatttggt atgtatttaa 1740aaggtttaaa ttgttttttt tttattttag agatagggtg ttattttatt gtttaggttg 1800gagcgtagtt tattttaatt tcgaaatttt ggttttaagc gattttttcg tttgggtttt 1860ttaaagcgtt ttaggattat agttttgaaa tattgtatcg gtttaaaaat tattataaat 1920ttttatgttt ttgttattgg attattttat tattattttt ttgtttttgt taatatttta 1980tttttgttag ttgttagaag agttttaaag tttgaattta tttgtgtttt tttggtagtg 2040gtaaatgtat aaacggttag ttagaacggt ttatttttgt agttattttt taggaagtgg 2100tagaagtttt agttttgaat tatatcgtgt ttatttttta agtttttttt ttgttttttt 2160ttgtattaaa agttaagcga gaattataat ttttaaagat ttagtgattt gggatttggg 2220ataggtaaat agggtataaa ttaataatgt tatttttttt ttattttata ggaaaataga 2280aaaatagtgg acggtgttcg tggtttttga atttttttta taggtttttt ttaaatatta 2340gttgttgaat tatttttttg gaattagatt agtaatttat aaagtatata attgtatggt 2400gttagtttta gaaaaagtgt tttgttgttg ttgttgttgt tatttgtttg ttttttagag 2460ataggggttt tattttgtta tttaggttgg aatgtagcgg tataattata gtttattgga 2520attttaaatt tttaggttta agttattttt ttgttttagt tttttaagta gatggaatta 2580taggtttgtg ttattacgtt tagttaatat tttttttata tatagatacg ggtttttgat 2640atgttgtata ggttggtttt aaatattagt tgtttagcga ttattttgtt ttaatttttt 2700ttagtatcgg gattataggg atgagttaga aaaagttttt agaaaaagtt ttaatgaata 2760tatgtagatg gtttagtagt tgtaaaatgt gtttttgttt ttgttttaga gagtgggttt 2820tattttgtta ttaagttgga gtgtagtggt aatattatag tttattgtag ttttgaattt 2880ttaggtttaa gcgatcgttt tattttagtt tttttagtag ttggaaatat aggcgagtat 2940tattttgttt agttttgtaa tgtgttttga atagtgtttg atattatagt aagttattat 3000atatgttttg ttttaaagta ataaatttgg tttgttacgg tggtttacgt ttgtaattta 3060gtattttggg agggtaaggt aggtagatta tgaggttagt agattgatat tattttggtt 3120aatatggtga aatttcgttt ttattgaaaa tataaaaatg atttgggcgt ggtagcgtac 3180gtttgtagtt ttaattattc gggaggttga ggtaggagaa tcgtttgaat ttaggaggcg 3240gcggttgtag tgagttaaga tcgtattatt gcgttttagt ttggtgatag agcgagattt 3300cgttttaaaa aaataataat aaaaattaat aaaaaataaa taaaataatg tattttagtt 3360taattgtata gtggtgaaat gatgtttttt atttatagaa gattttttag attttacgta 3420gtttgttttg tttgttgagg ttatagtaag tatgtttttt ttttatagag agaagtttgg 3480taggattaaa gattatttgt tttgtttttg gtattagatt aggatttgaa tttgaatttt 3540attagtttat ttgttgtgag agtttttgta aattatttta tttttgtttg gagtttgtaa 3600attttatatt tttaagaaaa aaatttattt tttggtgttt gaaatatgat tgtggaattt 3660tttttttttg tttttttttt tttttttttt tttttgttga tttttggtag taaaatagaa 3720ttttataaat tgtagagatg ttttttttgg gtaatataga gcgttaatat gagttaatgt 3780ttgtaaattt tgagagtaag tgttttaggt tttgatggga gtatggtgat atttaattta 3840ggagattttt agtattgtgt ttcgtttagt aattttattt agtaaggttt tgtttttaaa 3900aagacgataa gataagtttt atgagtaagt gattttttag taaaaaggat ttagtatgaa 3960ttagggaaaa aatagttacg tataagattt tagtaaaata ttagaggatg ttgataaaga 4020gggttatatg ttttaagtaa agttagtttt taggtaggtt aagatttata ttataggttt 4080agagaaatcg tgagtgatag gtagttttga ttataattaa agagtagttg tttaagattt 4140tagtaattat taagaaaggg agatgttata atttaggttt tagagagtaa tatttaaggt 4200taaggttgat atattaagtt tttttttagt attattaggt attttggggg taaggaaagt 4260gtatagaatt aaagttaggt agatgtgggt tttaatttta attagttgtt ggtttgggga 4320gaggggtttt gtttattttg tgttttagtt tttttatttt cgaaataaga attttattat 4380ttgttggata tatacgaatt ttatggtaag gatgaaaaat gtgtataaag atgaatagaa 4440tatagagttt agaaatagat ttagtttgtt ttgtattgtt ataatggaat attcgagttt 4500gggtaattta taaagaaaaa atggtttatt tggtttataa ttttaatggt tggaaagttt 4560aagattggat atttgtatgt ggagagggtt ttaggttgtt tttatttatg gtaaaagatg 4620aaagggagtg tgcgtgtgtg tagagattat atgataagag tataagtaag agggagagga 4680gagaagggtt cggttttttt aaataattag tttcggagtt atttaataga gtgaaaattt 4740attttttcgt tttatttatt tttaggaagg atattttatg aaggatttat attcgtgaat 4800taaatatttt ttattaggtt ttatttttaa tattggggat taaattttaa tatgaggttt 4860ggagggtata aatatcgaaa tttaaatagt agtttagatt tatataaata gttgatttag 4920agtggttaag ataagttaat ggagataaga tagttttttt aataaatggt tttggaataa 4980ttggatttgg atcgttatat gtaaaaaata aatttagata tagattttaa tattttatat 5040agtaattaat ttaaaataga ttataggttt aaatgtaaaa tataaattta taaaatgttt 5100agaagataat ataggaggaa atttattaat ggttttttag atataatagt aaaagtatta 5160tttatgaaag aaatgattgt taagttggtt tttattaaag ttaaaatttt ttggtttgta 5220aagataatgt taaggtaatg aaaagataag ttataggttg ggagaaaatt tttgtaaaat 5280atatatttga taaaggattg gtatttaaaa tatataaagg atttttaaaa ttgagtaata 5340agaaaatatt ttattttaaa aatatagtag ggcgcggtgg tttacgtttg gaattttagt 5400attttgggag atcgatatag gtggattatt tgaggttagg agtttgagat tagtttggtt 5460aatatggtga aattttgttt ttaataaaaa tataaaaaat tagttatgta tgatgatagg 5520tatttgtaat tttagttatt tgggaggttg atataggaga attattggaa tttgggaggt 5580ggaggttgta gtgagttaag agtacgttat tgtattgtag tttgggcgat aagagtgaaa 5640tgttgtttta aaaataaata aataaataaa taaataaata aataaaaata gataaaagat 5700ttgaatagat tttttattaa agataatata tatataataa ataagtatat ggaaaaatat 5760ttaatattat atattatcgg agaaattgta gattaaagta aagagatatt attatataat 5820tattgaataa ttaaaattta aaatattggt agtattaaat gcgggcgagg atatggcgta 5880ataaattttt atttattgtt agtgaggatg cgaaatagta tagttatttt ggaagataat 5940gtgatagttt tttataaaat taaatatagt tttattatat tatttagtag ttaggttttt 6000tggtatttat ttaaatgtat tgaaaatgta tgt 6033 33 5574 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 33 tttaaatttagggttgtatt agatttgagt agggattgag ggtaggttag ggcgtaggtt 60 aggggagaggggagaaagag taggggaaag agggaatttg ttaaattagg gttatgattt 120 aaatttgtttagaatcgttt atttatttta ttttattttg ttttagggag gagagtagaa 180 gttgagttattgggtgggtg ggatagaagt gaattagtcg tgaaaatatg gggggtagcg 240 gggagatggggagggtagga aatgtaaatt gcgtatttta gaggttttgg gtttttttta 300 cgggaggggatggagaattt atttggagtt ttttttagtt ttaaatgttc gagtgtaggt 360 ttttgggcgtttttttaaaa ggtggtttgg gtggatgaga ggaggtagtt tggaattaaa 420 tggttgggtgttaaatgtag ggaatgaagg agaaggtttg gggaggggtg ggtattttga 480 ggaagaaggattagatttag gattgtaggg gaaatgtttt ttgggttgtg agtggtagtt 540 agttgggagtttgtttttag gtatagagga agaggatttt tttaggggtt ttgatatttg 600 attagatgttaggtaaattt taagtagtta gtatatgttt ttttttttgt ttttttttgt 660 ttttgatttatttttttatt tttttttagt tttgagtttt tttcggattt ttcggaaatt 720 ttttttagagttaggagtaa tttgtaggtt ggaagttttt tattttttgt atttttttaa 780 tttgtttttagtttattttg gttaagggtt gaatttatgt gtttttggga ttattggggt 840 tgagttggtttgggttatag ggtattagaa gggagaggtt tttattgtag tgttttagaa 900 gtaattatattttaggtttg ggaggggtgg gttgagttat agtaaggtta tagtagggat 960 atatattttttttgggtttt tgttggtttt ttttttatat tcgttgtttt tttgttttag 1020 tttttcggtttcgtgcgttt ttttttggtt tttggtggaa tagttaggtt tttttattta 1080 aagtttaaagttttaaatag ttttttgaat ttgtttttta tttttttatt tattttatta 1140 tttattgtaattaattgatt gatttttaaa ttagttaatt ttttaaaatt aagtaattag 1200 ttaattttttaaaattaagt aattaattaa ttttttaaaa ttaagtagtt aatttttttt 1260 aattaagtaattaattaatt ttaaaaagta tttatttatt ttgagataaa gttttatttt 1320 gttgtttaggttggagtata gtggtttagc gttttattgt aattttcgtt ttttcgagtt 1380 taagcgatttttttgtttta gttttcggag tagttgggat tataggagtt tgatattatg 1440 ttaggttaatttttgtattt ttagtggaga cggggtttta ttatgttggt taggttggtt 1500 tcgaacgtttgattttaagt gatttgttta ttttggtttt ttaaagtgtt gggatgatag 1560 gtatgagttattgcgtttag ttaataattt atttattttt gagatagggt tttattcggt 1620 tgtttaggttgaagtgtagt agtataatta tggtttattg tagttttgat ttttggggtt 1680 taagtagtttttttgtttta gttttttaag tagttgggat tgtaggtgta cgttattata 1740 tttcggtaattttataaatt atttgtagag atgaggtttt tattatgttg tttaggttgg 1800 ttttaaatttttgggttcga gtaatttttt tatttttgtt ttttaaagtt ttgggattat 1860 aggcgtgagttattgtattt atttttattt tttatttttg ttttttaaaa tttatttttt 1920 ttataagttttaaaaattag tatgggaaat attggggaat attgttagga aaagtaatat 1980 aattatttgttagagaaaga aattagggtt agtattatgt aatagcgggg tataaggttt 2040 ttttttttttattttagtag gtgatgtggg taaggttttt ttttatatgg ttttgtttga 2100 tttttgattttttttttttt tatttttttt ttagttgtag aggagaattt taaggagagt 2160 aaattttaagtaggtattgt tcgtttatag gatgtgaatc gtagagatta atagaggaat 2220 ttaggtatttttattacgtt tttttagttt aattttgcgg gtgtttaaga tattgagatg 2280 gtgcgtttggagttggtagg gagtaggagg ggtgggaagt tttggagatt tttatttgag 2340 attgtttttttgggtttgga gacgttttta ttgtttgttt tgggtgtttg tttggtgggt 2400 tagaaggttggaatggggag ttgggttgga gcggttttaa gttgtttatt tttttttttt 2460 tagggtttatgtcgtagata tttggattta gtgttgtagt aattttagat tgaggtttat 2520 cgaggggtttaaatatttta cgtgtttaat tgtgattatc gaggttttta tcggaagcgg 2580 taggtgagattatttttttt ttttttttgt tttagtagaa ggtttttgtt agggagtggg 2640 ggcggtgttgtttataaagt tgtataaata agatattgtt ttatttttaa ggatttttta 2700 attttaggagaatatagaga atataattta ttaaataaat ttagagaata attaattata 2760 tattgtgagagaaaatttat ttaaggaatg ttttaattta gtggtttttg aatttgaggt 2820 attagaatttttcggagggt ttatgttata tagatagttg agttttatcg gtagtttttt 2880 tgatttaggaggtgtggggt ggggtttgat aatatgtatt tttaatatgt tttttcgtga 2940 ttcggatttgggaacgttat tttgaaaatt attgttttag gttagtagaa tgtatataat 3000 ttattggttgaagaggggga attaaagaga gggaatattg ggtcgggtgc ggtgttttat 3060 gtttgtaattttagtatttt gggaggttaa ggttggtgga ttacgaggtt aggagtttaa 3120 gattagtttgaataatttgg tgaaatttta tttgttttaa aaattataaa aattagttag 3180 atgtggtggtatgtatttgt aattttagtt atttaggagg ttgaggtaag agaattgttt 3240 gaatttgggaggtggaggtt gtagtgagta gagattatgt taatgtattt tagttagggc 3300 gatagagcgagattttattt taaaaaaaaa aaaaaaaaaa aaaaaaagag agggaatttt 3360 cgaggagacgtttaggtgtt tttatatttt tagatttaga tgtttttttt tatttttttg 3420 ttggaagtttttggttttat ttttgatttg tgtgtttttt tttttagtgt cgtttttttt 3480 aggggtagcgtcgaggtttt tgttggtgtg tggatcggat gggtaagttt ttgttagggt 3540 ttttagatggtaatggaagt tttttttgtt ttattgggag tagcggttaa agttggggga 3600 tagaggggttgtagggttat tggaaggaat atggagttgt tattatttaa taaaaaatcg 3660 aggtttttaatttattttta ggtttcgttt tatgggtttt ttatcgttgg ttggaaagag 3720 tgttggtgttggttggggtg ttaataaagt tgtgtttggg gtcgttggtt tgtgtttttg 3780 tgtttgttttttataatttt ggaatttttg gttttttttt tattttatta tagtttattt 3840 atagtatttttttttttttg tggatatttt tagttttttt tgtgatagtt aggtagaagt 3900 tttaagttattaagttttat agagttgttt attaggagtt gggagtggga aggggagata 3960 ttgagattatggttttaatt tgaagttgtg attttgtttt taatattgat ttttggatat 4020 aaagggaggggaaggattaa tagttaattt tagtaggaat ttagtaaaga ggaattttta 4080 aagtatatatttttttgtta ttttttatta aaaaaagaag gaaattatta ttaatatatg 4140 agtttattttatggttttga attatgtgat tttatttgga taattttatt ttgagtttac 4200 gataattttgtgatataggg atttttattt ttatttttta gaggaggaaa ttggtttaaa 4260 atttggggttatttgtttga aattatatag ttggtaaatg atagagggag gtttgtattc 4320 ggtttttttatatgtgataa tatttggtat tttttaggtg ttgaatacgt gtttgtttag 4380 ttttttttttgtttatatgt ttatttaagt aggtgttagg aagcggtttt gttagtttag 4440 gggttttgatatttagtttt ttttggaggg gttttagttt cgtgagtagt atagtgttaa 4500 ttttattagaatattattat atgtgttaat tatatatttt gtggtgaaag cgagttgaac 4560 gtattgatatatgaagatat ttttgatttt tttttgattt ttagtttgtt gggagagaga 4620 ttggaaggttagttatgtta ggtgataagt ttttgagagg taaagttttt ttttttaaga 4680 tgtatttagttattattttt gtgtgtgtgt ggcggggtgg atagtatttt tggagttggg 4740 tatttggatggtggttgggg tgttaggggg atgtggcgat ttttgcgata gatagtagag 4800 tgaggtttgaatttgagaag ttttgttttt agattagata atttatcgta tttttagagg 4860 ttttttttttttgaaaggat tttagttttt ggagttgtta tttgagttga gtgggataag 4920 agttttatagggtaggttat attgcgaagg aaggaggtaa tacgggtaag ggttgtttgt 4980 tgttcgttggagatcgtatt atggagttag gcggggttcg tttgcgtttg tagaggatag 5040 aagggttgggaggggagcgg gagcgttaat tttgtggaga tggtgagtcg ttttcggggg 5100 tgtagaaggtataggtaagt gggggggagg cggggagaga tgcgttatgg agagaaggtt 5160 ttaattgtttgatgttaatt ttttttgttg tttagagagg ttaaggaagg tagattttgg 5220 ttttagtttagagttattta gttggaagat ggaatagaaa agagttatgt tagagttgtg 5280 gtttggttttatttttttga ttgtttagtt ttagatagtg aatggagtag ttttttattt 5340 tttgagtgttttgtttttag taatgttatt aggttttttg tttgtttatg gtttttttat 5400 tattggtaatagtaattttt ttttttagta gttttaatta tgatattaga tattggttgg 5460 ttggggtgagggtagttgtt gagtatataa agtatttttt gattatagga tgtttttggg 5520 tttgtagaattttaattttt tttgttgatt gtgtttttga ttttttttta tagg 5574 34 5574 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 34tttgtgagga gggattaaag gtatagttaa taggaggaat tggggttttg tagatttaga 60ggtattttgt ggttaggaaa tgttttgtgt gtttagtagt tgtttttatt ttaattagtt 120aatatttagt attatggttg gggttattag aaggggaagt tgttgttgtt agtggtgagg 180aggttatagg taagtagggg gtttggtgat attattggga atagggtatt tagggaatgg 240gaagttattt tatttattat ttggggttaa atagttagaa ggataaggtt aggttatagt 300tttgatatag tttttttttg ttttattttt tagttgggtg gttttgggtt gaggttaggg 360tttatttttt ttggtttttt tggatagtag gaaggattgg tattaggtag ttggagtttt 420ttttttatag cgtatttttt ttcgtttttt ttttatttgt ttgtgttttt tgtattttcg 480agggcggttt attattttta tagggttggc gttttcgttt tttttttagt ttttttgttt 540tttgtagacg tagacgggtt tcgtttggtt ttatggtgcg gtttttagcg ggtagtaggt 600agtttttgtt cgtgttgttt ttttttttcg tagtgtggtt tgttttgtag agtttttgtt 660ttatttagtt taggtgatag ttttaaagat taaagttttt ttaggaggag ggggtttttg 720ggagtgcgat aggttatttg atttggaggt agagtttttt agatttagat tttattttgt 780tgtttgtcgt agggatcgtt atattttttt aatattttaa ttattattta gatgtttagt 840tttaagggtg ttatttattt cgttatatat atataggaat agtggttggg tatattttgg 900ggaggggaat tttgtttttt agaagtttgt tatttagtat ggttggtttt ttagtttttt 960ttttagtagg ttgaaggtta gggaggagtt agaaatgttt ttatgtatta gtgcgtttag 1020ttcgttttta ttataaggtg tgtgattgat atatgtggta atattttgat ggggttggta 1080ttgtgttatt tacggaattg gggttttttt aggaaaggtt gagtgttagg gtttttgaat 1140tgatagggtc gttttttgat atttgtttgg gtgagtatgt aggtagaaag gagattaaat 1200aaatacgtat ttagtattta gggaatatta ggtattgtta tatatggaag aatcggatgt 1260aaattttttt ttgttattta ttagttatat aattttaggt aagtgatttt aaattttaag 1320ttagtttttt tttttgaaaa ataggggtaa aaatttttat attataaggt tatcgtaagt 1380ttaaaatgag gttgtttagg taaaattata tggtttaggg ttatgggatg agtttatata 1440ttagtaataa tttttttttt tttttagtag gaagtaatag aagggtatgt gttttgagag 1500tttttttttg ttgggttttt gttgggatta attattaatt tttttttttt ttttgtgttt 1560aaagattagt gttagaaata aggttataat tttagattaa ggttatgatt ttagtgtttt 1620ttttttttat ttttaatttt tggtgggtag ttttgtgagg tttgatggtt tgaagttttt 1680gtttggttgt tataggaagg attaaaggta tttataggaa aggagaaatg ttgtgagtga 1740gttgtagtgg ggtaaagaga gggttaggga ttttagaatt gtgagaggta gatatagaga 1800tataagttag cgattttaag tatagtttta ttgatatttt agttaatatt aatatttttt 1860ttaattagcg gtgaggggtt tatggggcgg ggtttgaagg tggattgagg gtttcggttt 1920tttgttgagt gatgatagtt ttatgttttt tttagtggtt ttgtagtttt tttatttttt 1980agttttagtc gttattttta gtggggtagg aggagttttt attgttattt ggagattttg 2040gtagggattt gtttattcga tttatatatt agtagggatt tcggcgttgt ttttgggagg 2100agcggtattg gagagagagg tatataggtt aggagtgagg ttagaggttt ttagtaggag 2160aatgagaggg gatatttgag tttgaggatg taaaaatatt tgagcgtttt ttcgggggtt 2220tttttttttt tttttttttt tttttttttt tttgagatgg agtttcgttt tgtcgttttg 2280gttggaatgt attggtatga tttttgttta ttgtaatttt tattttttag gtttaagtaa 2340tttttttgtt ttagtttttt gagtagttgg gattataggt gtatgttatt atatttggtt 2400aatttttgta atttttaaaa tagatggggt tttattaggt tgtttaggtt gattttgaat 2460ttttgatttc gtgatttatt agttttggtt ttttaaagtg ttgggattat aggtatgaga 2520tatcgtattc ggtttagtgt tttttttttt tagttttttt tttttaatta ataaattgtg 2580tgtattttgt tagtttggaa tagtagtttt taaagtgacg tttttaaatt cggattacga 2640gggaatatgt tagaaatgta tattgttagg ttttatttta tattttttga attaggaagg 2700ttgtcggtgg ggtttagtta tttgtgtggt ataagttttt cggaggattt tgatgtttta 2760agtttaagag ttattgagtt agggtatttt ttaagtgggt ttttttttat agtgtgtggt 2820tgattatttt ttaagtttgt ttaataaatt atatttttta tgttttttta aagttggaag 2880atttttaaag atggggtagt gttttattta tgtagttttg taagtagtat cgtttttatt 2940ttttggtagg agttttttgt tggagtagga ggagaagaaa aatagtttta tttgtcgttt 3000tcggtagaag tttcgatggt tataattggg tacgtagagt gtttgagttt ttcggtagat 3060tttagtttgg agttgttgta gtattgagtt tagatgttta cggtatgggt tttggggaag 3120ggagagtagg tagtttagaa tcgttttagt ttagtttttt attttaattt tttggtttat 3180taggtaagta tttaggatag ataatggaga cgtttttaag tttaagggag tagttttaga 3240tggaagtttt tagggttttt tatttttttt gttttttatt agttttaaac gtattatttt 3300agtgttttgg atattcgtag aattgggttg ggagggcgtg gtagaggtgt ttggattttt 3360ttgttggttt ttgcggttta tattttgtgg gcgggtagtg tttgtttggg gtttattttt 3420tttaggattt ttttttgtaa ttggaggagg aataggagaa ggagaggtta gaaattaggt 3480agagttatgt ggagaagggt tttgtttata ttatttgttg aagtaaggaa gggagggttt 3540tatgtttcgt tgttgtatga tgttggtttt agtttttttt tttgataaat agttatatta 3600ttttttttga taatattttt tagtattttt tatattgatt tttaaggttt ataaaggaga 3660tgaattttgg aaagtaaaaa tggaaaatga ggatgggtgt aatggtttac gtttgtaatt 3720ttagaatttt gagaagtaga ggtgggagga ttgttcgagt ttaggagttt gagattagtt 3780tgggtaatat aatgagaatt ttatttttat aaataattta taaaattatc gaggtgtggt 3840ggcgtgtatt tgtagtttta gttatttgag aggttgaggt aggaggattg tttgagtttt 3900agaagttaag attgtagtga gttatgattg tgttattgta ttttagtttg gataatcgag 3960tgagattttg ttttaaaaat aaataaatta ttggttgggc gtagtggttt atgtttgtta 4020ttttagtatt ttgggaggtt aaggtgggta gattatttga ggttaggcgt tcgagattag 4080tttggttaat atggtgaaat ttcgttttta ttaaaaatat aaaaattagt ttggtatggt 4140attaggtttt tgtagtttta gttatttcgg aggttgagat aggagaatcg tttgaattcg 4200ggggggcgga ggttgtagtg agacgttgga ttattgtatt ttagtttggg taatagagtg 4260agattttgtt ttaaaataaa taaatatttt ttaaaattaa ttaattattt aattaaaaaa 4320aattaattat ttaattttaa aaaattaatt aattatttaa ttttaaaaaa ttaattaatt 4380atttaatttt aaaaaattaa ttaatttaaa aattaattaa ttaattataa taaataataa 4440aataaatgaa aaaatggaga ataaatttaa aggattattt ggggttttgg gttttgggtg 4500aaaagatttg gttgttttat tagaggttag aagggggcgt acgaagtcgg agagttgggg 4560tagaagagta acggatgtag gaggggggtt aatagggatt taaaaggaat gtgtgttttt 4620gttgtgattt tgttatgatt taatttattt tttttaggtt tgagatgtgg ttatttttgg 4680ggtattgtag tgggaatttt ttttttttgg tattttgtga tttaggttag tttaatttta 4740gtggttttag gagtatatgg atttaatttt taattaagat aggttgaggg tagattaaga 4800aggtgtaagg aatgaggggt ttttaatttg taggttgttt ttggttttgg agaaagtttt 4860cggagggttc ggggagagtt taggattggg aaggggtgag gaaataagtt agggatagga 4920aaaggtagaa aggggagtat gtattgattg tttggaattt gtttaatatt taattagata 4980ttagaatttt tgaagggatt tttttttttt gtgtttaaag ataagttttt agttaattat 5040tatttataat ttaggagata ttttttttgt aattttgagt ttgatttttt ttttttagga 5100tgtttatttt tttttagatt ttttttttta ttttttatat ttagtattta attatttagt 5160tttaaattgt ttttttttat ttatttagat tattttttag gaggacgttt agaagtttgt 5220attcgggtat ttggaattga aagaaatttt aagtgaattt tttatttttt ttcgtggaag 5280gaatttagag tttttgggat gcgtagtttg tattttttgt tttttttatt ttttcgttgt 5340tttttatgtt tttacggttg atttattttt gttttattta tttagtgatt tagtttttgt 5400tttttttttt ggagtagggt ggggtaggat gggtgaacga ttttgagtag gtttaaatta 5460taattttgat ttggtagatt tttttttttt tttatttttt tttttttttt ttttaattta 5520cgttttagtt tgtttttagt ttttatttaa gtttaatata attttggatt tggg 5574 35 6207DNA Artificial Sequence chemically treated genomic DNA (Homo sapiens) 35ttagtgttat aaattttttt ttatatattg ttttaaatgt gttttagaga ttttggtatt 60ttgtgttttt gtttttattg gttttaagga atatttttat ttttgttttt attttattat 120ttatttagta gttatttagg aatagtatag tttttatgta gttttgtggt tttgagtgag 180ttttttaatt ttgagtttta atttgattgc gttgtggttt tagaggtagt gtgttgtgat 240ttttgttttt ttatatttgt tgagaagtgt tttattttta attatgtggt taattttgga 300ataagtgtta tgtggtgttt agaagaatgt atattttgtt gatttggggt ggagagtttt 360gtagatgttt attaggtttg tttggtgtag agttgagttt aagttttgga tatttttgtt 420aatattttgt tttgttgatt tgtttaatat tgatagttgg atgttaaagt tttttattat 480tatggtgtgg gagtttaagt ttttttgtaa gtttttaagg atttgtttta tgaatttggg 540tgtttttgta ttgggtgtat aaatatttag gatagttagt tttttttttt gaattgattt 600ttttattatt atgtaatggt tttttttgtt ttttgatttt tgttggttta aagtttgttt 660tattagagat taggattgaa atttttgttt tttttttttt ttttttggtt ttttatttgt 720ttgttagatt tttttttatt tttttatttt gagtcgatgt gagtttttgt aggtgagatg 780ggttttttga atatagtata ttgatgggtt ttgaattttt atttaatttg ttagtttatg 840ttttttaatt ggggtattta gttcgtttat atttaaggtt aatatagtag gttttagaag 900gttggtaata atatattttt tttagttaaa gaaggatgtt tgaatttatt atgtattgtt 960atgtgtgaat ttgattttgt tattttgatg ttagttggtt attttgttta ttatttaatg 1020tatttttttt ttagtattga tggtttttaa aatttggtat gtttttgtag tggttggtat 1080tggttgttgt tttttatgtt tagtgttttt tttaggagtt tttgtaaggg aggtttggtg 1140gtgataaaat tttttagtat ttgtttgttt gtaaagtatt ttattttttt tttatttatg 1200atgtttagtt tggttgaata tgaaattttg ggttgaaaat tttttttttg aagaatgttg 1260aatattggtt tttatttttt tttggtttgt agagtttttg ttgagagatt tagtgttagt 1320ttgaggggtt tttttttgtg ggtaattcga tttttttttt tggttgcgtt taatattttt 1380ttttttattt taattttggt gaatttggta attgtgtgtt tcggggttgt tttttttgag 1440gagtattttt gtggtgtttt ttgtattttt ttaatttgaa tgttggtttg ttttgttagg 1500ttgtggaagt ttttttggat aatattttga agagtgtttt ttaatttgtt tttatttttt 1560ttgttatttt taggtatatt aattaaatgt agatttggtt tttttatata gttttatatt 1620tttcggaggt tttgtttatt tttttttatt tttttttttt taaatttttt tttttatttt 1680attttattaa tttgattttt aattattgat attttttttt ttatttgaat gaattggttg 1740ttgaagtttg tgtatgtatt atatagtttt tgtgttatgg tttttagttt tattaggtta 1800tttaaggttt tttttatatt atttatttta gttagttatt cgtttaattt ttttttaagg 1860tttttagttt ttttgcgatg ggtttgaata ttttttttta gttgggagaa gtatgttatt 1920attaattttt tgaagtttat tttttttagt ttattaaagt tatttttcgt ttatttttgg 1980ttcgttgttg atgaggagtt gtgatttttt ggaggagaag aggtattttg gattttagaa 2040tttttcgttt ttttgttttg gttttttttt attttcgtgg ttttatttat ttttgatgtt 2100ggtgatttat agatggggtt ttggtgtgga tgtttttttt gttgatgttg atgttatttt 2160tatttgttag tttttttttt aagagttagg ttttttagtt gtagatttgt tggagtttgc 2220gggaggttaa ttttaaattt tgtttatttg agtattatta gtggaggttg tagaatagta 2280aatattgtag aagagtaaat gttgttgttt gatttttttt ttggaagttt cgttttatag 2340gggtattcgt ttgtatgagg tgttagttgg tttttattgg gaagtgtttt ttagttaggt 2400tatatggggg ttagggattt atttgaggag gtagtttgtt tatttttaga gtttaaatat 2460tgtattggga gagttattgt tttttttaga gttgttagat agggacgttt aagtttgtag 2520aagtttttgt tgttttttgt ttatttatgt tttgttttta gaggtgaggt ttatagaggt 2580agtagatttt gtagagttgc ggtgggtttt gtttagttta attttttcgg ttgttttgtt 2640tatttattta agttttagta atggcggacg tttttttttt gttaggttgt tgttttagat 2700tgttgtgtta gtagtgagta aggttttgtg ggcgtgggat ttattgagtt aggtatagga 2760tttaattttt tggtgtgtta tttgttaaga tcgttggaaa agtgtagtat ttgggtgaga 2820gtgttttgat tttttaggta tagtttgtta tagttttttt tggttaggaa agggaaattt 2880tttaatcgtt tgcgtttttc gggtgaggta atgttttttt ttgtttcggt ttatttttta 2940tgggttgtag ttattgttta attagtttta atgagatgaa ttaggtattt tagttggaaa 3000tgtagaaatt atcgtttttt gtatcgatta tattgggagt tgtagatcgg agttgttttt 3060atttggttat tttggaacgg aatttggatg atttattttt ggttattaat ttggaagttt 3120tatgttagta ggttatttta gattttttga attttttagg taattaagcg ggtaaggtgt 3180ttaaattgaa agtttagttt tgtttataat aagttaaata tttaggttta attttagtta 3240gaggaattag ggtttttagt aaggaataaa tatagtttat attggtatcg gttttttaag 3300gcgtagtatt aattagattg ataaatttat ttatttgatt ttgtggtttt cgtttagaaa 3360ttgatttagt ttaagaagat agtttagatt ttttatgatt ttatttttga tttaaataat 3420tagtattttt gatttattgg ttttttttta tttattaaat tatttttaaa aattttgagt 3480tttcgtatgt tcgaatgttt ggggagtcgg atttgagtaa taatgaaatt ttagtttttt 3540gtatagttgg ttttgtatga attttttttt tattgtagtt tttttgtttt gataaattag 3600ttttgtttag gtagtaggta aggtgaattt attgggcggt tatatattgg ggagggggga 3660ttgtaaggga atgaaatttt gagtattatt tttaaaggag ggaggggttt tatagattta 3720ggtttattta gaagcgtttt tttttttaga gagtaaaatt ttattgtttt ttagagggtt 3780gagaggtttg aaggaagagt ttgggtagaa attttgtttt gaatagaagt agtagattta 3840gttgagagaa agaggtttat aaattttatt ttatggtttt ttttttttta aagatagatt 3900tttatttttg ttgtttaggt tggtgttgaa tggtatgatt ttagtttatt gtaattatgt 3960tttttaggtt taagttattt ttttgttatt agtttttcga gtagttgaga ttaaggcgta 4020tgttattatg ttcggttaat ttttgtattt ttagtagaga cggggttttt attatattgg 4080ttaggttggt ttcgaatttt tgattttagg tgatttattt gtttcggttt tttaaagtgt 4140tgggattata ggtaagagtt attgcgttcg gttttatgtt ttttttatat ttaagtatta 4200ggtttatgta atgatgtacg aatttattta tttttattcg tgttaggttt ttttttgggg 4260gttggagata aagggtcgac gtggacgttg cgttatggta gtatttgttt cgtaaagtgt 4320atatcgtgtt ttatttatag ttttagtatt ttcgttgtta ggaatatgga tttttaggta 4380gtattttaga tttagattta ttgtattaga atttttgtgt tggttttgag aatgtgtatt 4440tttaatagcg ttttatattt tttattttaa tttttttgta gttaacgttt gagagcgttg 4500gtttggtgtt tattgttttt gtaggcggtt tttaaggtag tcgtgtgtgt ttgtatgtga 4560ggcggtaaaa atagcgcgtt gtagggtcgg cgcggtggtt tacgtttgta attttagtat 4620tttgggaggc ggaggcgggt ggattacgag gttaggatat cgagattatt ttggttaata 4680cggtgaaatt tcgtttttat taaataaaaa tacgtggtgg tgggcgtttg tagttttagt 4740tattcgggag gttgaggtag gagaatggtt tgaattcggg aggtagagtt tgtagtgagt 4800cgggatcgta ttattgtatt ttagtttcgg cgataaataa ataaataaat aaaaaaaata 4860gcgcgttgta gatggagtta gtattcgggt ttttcgtttt tagttttttt tcgaagtttc 4920gtttcgtttt cgggtttgga ggaggttggg aagtttcgtt tttttacgtt agcgtcgttt 4980aggttggtat aaaggaggaa gtttagtttc gtttttgcgt gcggcgtttt ttttaggttt 5040tattttttat ttagtgtttt ggattttcgg ttgggtagcg ttattagagc gattaaacgt 5100ttcgcgtttt ttaggtcgta ttttagagtt aaaagagttt tatggcggcg gcggttaagt 5160ttaataattt ttttttggtg gtgtacggat cgggggattt gcgtttggta agttgggaag 5220gagggtggga agtatatcga ttttgtttta tttttttntg agtttagtta tagttttggt 5280tttttatttt tagtttggcg tcggtttcgt attttaagcg ttttggttgt ttagatttta 5340gttggttttt ttcggggtgt gggggtagta ggtagtggtt gttgcgaagg gtagggattt 5400agtcgtgtgt ttttcggaat ttagtttcgt ggttggtacg tggtcggtgt ttaggacggt 5460tgtaaattgt ttgaatgaag tttttttttt tttttgttag ttgtagattt atagtttagt 5520tttttgttat tgattttttt aaaggaaatg ttaaggttgt ttgaattatc ggggtagatc 5580gtgtagagta gagaaagggg ggttagagga tatttagaaa tagtagaatt tgtatttaat 5640ttttttgttt gggattgata aatttttttt gtaggattat gatgattata agagtattta 5700gtatttagta cgtgtttagg aagtgttagt tttttttttt ttttttttag tttaggtttt 5760tatttttaga atttttgttg ttttttttgt ttgtgttaga tttgtggatt ttgatagttt 5820ttttgtttgt aaggattttt ttttttttaa gattttgttt ggtttatttt ttagtagttt 5880ttttttttaa tttcgtgttt ttgttttttt aggagtattt tgtatgtgtg ttttttgttt 5940tagattttgt tttttgtttt ttggtttgtg gtattaaagt ttaggaagtg gttgagttag 6000tagtttagtt atgttaagtt ttttttgata aagttttttt tagatgggtt tgggatggta 6060gtgggtatgt gggatgagtg ttagttattt ttgttgtttt tttgtatttt ttttttttta 6120aagtatatgc gttagtatgt aaattgtagt aatttagaag tttatttagg ttagtagttt 6180ttgattattt aagaatttgt ggtgttt 6207 36 6207 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 36 ggatattata gatttttaaatagttaagaa ttgttaattt ggataagttt ttgaattatt 60 gtagtttata tattgacgtatgtattttga gggaaaagag gtatagggga gtagtagaga 120 tggttggtat ttattttatatatttattgt tattttaggt ttatttgaga gggattttgt 180 taagggaggt ttggtatgattaggttgttg atttagttat tttttaaatt ttggtgttat 240 aagttaggga gtaaaaggtagggtttaagg tagaggatat atatatagaa tgtttttaaa 300 gggatagagg tacgggattggaaagaaaaa ttgttggaaa gtgaattaga tagggtttta 360 gggagagaag gatttttatagataagggag ttattaagat ttataagttt ggtataggta 420 aggggaatag taggggttttggagatggag gtttagattg gaaggaaagg agaaggagtt 480 ggtatttttt gagtacgtattaagtgttga gtatttttgt gattattata attttgtaag 540 ggaggtttat tagttttaagtaagggagtt aaatataagt tttgttgttt ttaagtgttt 600 tttggttttt ttttttttgttttgtacggt ttgtttcgat aatttagata gttttagtat 660 tttttttgga aaggttaatgataagaggtt ggattatgaa tttgtagttg gtaaaggaga 720 gagaaagttt tatttaaatagtttgtaatc gttttgggta tcggttacgt gttagttacg 780 gggttaggtt tcgggaggtatacgattaga tttttgtttt tcgtaatagt tattatttgt 840 tgtttttata tttcgaggggaattagttgg gatttgggta gttagggcgt ttaaggtgcg 900 gggtcggcgt taggttggaagtgggaagtt aggattatgg ttgggtttan aggagagtga 960 ggtaggatcg gtatgttttttatttttttt tttagtttat taggcgtaag tttttcggtt 1020 cgtgtattat tagggaaaggttgttgggtt tggtcgtcgt cgttatggag tttttttggt 1080 tttggagtgc ggtttggaaggcgcgggacg tttggtcgtt ttggtggcgt tatttagtcg 1140 agggtttagg gtattggatggaaggtgggg tttgggagaa gcgtcgtacg taggggcggg 1200 attaggtttt tttttttgtgttagtttggg cggcgttagc gtggaggggc ggggtttttt 1260 agtttttttt agattcggaggcggggcggg gtttcgggag ggggttggga gcgagaagtt 1320 cgggtgttgg ttttatttgtagcgcgttgt tttttttgtt tgtttgtttg tttgtcgtcg 1380 aggttggagt atagtggtgcgatttcggtt tattgtaagt tttgtttttc gggtttaagt 1440 tatttttttg ttttagtttttcgaatagtt gggattatag gcgtttatta ttacgtattt 1500 ttgtttagta gagacggggttttatcgtgt tagttaggat ggtttcgata ttttgatttc 1560 gtgatttatt cgttttcgttttttaaagtg ttgggattat aggcgtgagt tatcgcgtcg 1620 gttttgtagc gcgttgtttttgtcgtttta tatgtaagta tatacggttg ttttgaaaat 1680 cgtttgtaga ggtagtaggtattagattag cgtttttaaa cgttagttgt agaagaattg 1740 gggtggggaa tgtgaggcgttgttgagaat gtatattttt aggattagta tagagatttt 1800 gatatagtag gtttaggtttgaggtgttgt ttgagggttt atatttttag taacgagaat 1860 gttgaggttg tgggtggagtacggtgtgta ttttgcgaga taggtgttat tatgacgtag 1920 cgtttacgtc ggttttttgtttttagtttt taggaaaggg tttggtacga gtaggagtaa 1980 atgaattcgt gtattattatatgggtttgg tgtttaagta taaaaaagat atgaggtcgg 2040 gcgtagtggt ttttgtttgtaattttagta ttttgggaag tcgaggtagg tggattattt 2100 gaggttagga gttcgagattagtttgatta atatggtgaa aatttcgttt ttattaaaaa 2160 tataaaaatt agtcgggtatggtggtatgc gttttaattt tagttattcg ggaggttgat 2220 gataggaaaa tagtttgaatttgggaagta tagttgtagt gagttgagat tatgttattt 2280 aatattagtt tgggtaataagagtgaaaat ttgtttttaa aaaaaaaaaa gttatgaaat 2340 ggaatttgtg aattttttttttttaattgg atttgttgtt tttatttaaa gtagagtttt 2400 tgtttaaatt ttttttttaagttttttagt tttttgagaa atagtgaggt tttatttttt 2460 gaggagagag gcgtttttagataggtttaa gtttataagg tttttttttt ttttgaggat 2520 aatgtttagg attttatttttttatagttt ttttttttta atatgtaatc gtttaatgga 2580 tttattttgt ttgttgtttagataaaatta atttattaag ataggggaat tgtaataggg 2640 aaagagttta tgtagaattagttatgtagg agattggaat tttattattg tttaaattcg 2700 gttttttaag tattcgagtatacggggatt tagagttttt aaggatagtt tgatgggtgg 2760 ggaaaggtta gtgagttaggagtgttgatt gtttgggtta gagatgaaat tataggggat 2820 ttaagttgtt tttttggattgagttagttt ttgggcgagg gttataaggt tagataagtg 2880 agtttattaa tttggttggtgttacgtttt gagggatcgg tgttagtata ggttgtattt 2940 gttttttgtt gagggttttggtttttttgg ttaagattag gtttagatat ttgatttgtt 3000 gtaggtagag ttgggtttttagtttagata ttttgttcgt ttgattattt agaaagttta 3060 agagatttag agtagtttgttggtatgagg tttttaaatt ggtagttaaa agtaaattat 3120 ttagatttcg ttttaagatggttaaatagg aatagtttcg gtttgtagtt tttagtgtga 3180 tcgatgtaga agacggtgatttttgtattt ttaattgagg tatttggttt attttattgg 3240 gattggttgg atagtggttgtagtttatgg agggtgagtc gaagtaggga ggggtattgt 3300 tttattcggg aagcgtaagcggttggggga tttttttttt ttagttaagg aaagttgtga 3360 tagattgtat ttggaaaattaggatatttt tatttaaata ttgtattttt ttaacggttt 3420 tagtaaatgg tatattaggagattaaattt tgtgtttggt ttagtgggtt ttacgtttat 3480 agagttttgt ttattattagtatagtagtt tgaggtagta gtttggtagg ggaggggcgt 3540 tcgttattgt tgaggtttgagtaggtaaat aaagtagtcg ggaaggttga attgggtaga 3600 gtttatcgta gttttgtaaggtttgttgtt tttgtagatt ttatttttgg gggtagggta 3660 taggtgaata aaagatagtagaaatttttg tagatttaaa cgtttttgtt tgatagtttt 3720 gaagagagta gtggtttttttagtatagtg tttgagtttt gagaatggat agattgtttt 3780 tttaagtggg tttttggtttttatgtagtt taattgggag atatttttta gtaggggtta 3840 attgatattt tatataggcgggtgtttttg tgggacgaag tttttagagg aaggattagg 3900 tagtaatatt tgtttttttgtaatatttgt tgttttgtag tttttattgg taatatttag 3960 gtaaataggg tttggagttgatttttcgta aattttaata gatttgtagt tgagggattt 4020 gatttttaga aggaaaattagtaaatagga atagtattaa tattaataaa aaggatattt 4080 atattaaaat tttatttgtaggttattagt attaaaggta gataaaatta cgaagatggg 4140 gagaaattag agtagaaaaacggaaaattt taaaatttag agtgtttttt tttttttaaa 4200 agattatagt tttttattagtaacggatta aaggtggacg gagaatgatt ttgatgagtt 4260 gagagaagta ggttttagaaggttggtaat aatatatttt ttttagttaa aggaggatgt 4320 ttaaatttat cgtaaagaagttaaaaattt tgaaaaaaga ttagacgaat ggttaattgg 4380 aataaatagt gtagagaagattttaaatga tttgatggag ttgaaaatta tggtataaga 4440 attatgtgat gtatgtataagttttaatag ttaatttatt taaatggaag aaaggatatt 4500 agtgattgaa gattaaattaatgaaataaa gtgagaggag aagtttagag aaaaaagagt 4560 aaaaagaaat gaataaagttttcgagaaat atgggattat gtgaaaagat taaatttata 4620 tttgattggt gtatttgaaagtgataggga gaatggaaat aagttggaaa atatttttta 4680 ggatattatt taggagaatttttataattt agtaagatag gttaatattt aaattaagga 4740 aatatagaga atattataaagatatttttt aagaagagta atttcgagat atataattgt 4800 tagatttatt aaggttgaaatgaaggaaaa aatgttaagc gtagttagag agaaaggtcg 4860 gattatttat aaagggaagttttttagatt agtattggat tttttagtag aaattttata 4920 agttagaaga gagtgggggttaatatttaa tattttttaa gaaaagaatt tttaatttag 4980 aattttatat ttagttaaattaagtattat aagtgaagga gaaataaaat attttataga 5040 taagtaaatg ttgagaggttttgttattat taggtttttt ttataagagt ttttgaagga 5100 aatattaaat atggaaagtaataattagta ttagttattg taaaaatatg ttaaatttta 5160 aagattatta atgttaggaagaaaatgtat taaataatgg gtaaaataat tagttaatat 5220 taaaatgata ggattaaatttatatataat aatgtatgat gggtttaaat attttttttt 5280 agttgggaga agtatgttattattaatttt ttgaagttta ttatattaat tttaaatata 5340 aacgggttaa atgttttagttaaaagatat ggattggtaa attaggtaaa gatttaagat 5400 ttattagtgt gttgtatttaggagatttat tttatttgta gagatttata tcggtttaaa 5460 ataaagggat ggaagaagatttaataagta aatggaaagt taaaaaaaaa aaaaaaaaag 5520 taggggtttt aattttagtttttgataaaa tagattttga attaataaag attaagagat 5580 agagaaggtt attatatagtggtaaaggga ttaatttaaa aagaagagtt aattatttta 5640 aatatttatg tatttaatataggagtattt agatttataa aataagtttt tagagattta 5700 taaagagatt tagatttttatattatgata atgggagatt ttaatattta attgttaata 5760 ttagatagat taataagatagaatgttaat aaggatattt aggatttgaa tttagttttg 5820 tattaggtag atttagtagatatttataga attttttatt ttaaattaat agaatatata 5880 tttttttaag tattatatagtatttatttt aaaattgatt atatagttgg aagtaaagta 5940 ttttttagta aatgtaaaagaatagaaatt ataatatatt gtttttgaga ttatagcgta 6000 attaaattag aatttaggattaagaaattt atttaaaatt ataaaattat atgaaaattg 6060 tattgttttt gaatgattattgggtaaata atgaaatgaa ggtagaaata aagatgtttt 6120 ttgaaattaa tgagaataaagatataaagt attagaattt ttgggatata tttaaagtag 6180 tgtgtagagg gaaatttatagtattaa 6207 37 5464 DNA Artificial Sequence chemically treated genomicDNA (Homo sapiens) 37 tattagagtg cgtaaggagg aaatagaggt aaattttggttttgatgaag aggtagaagg 60 ggttaggagg tttttattat tgtttgtttt ttgtaaggttatttaaaaag tgaagagata 120 tttttaaagt gagtattgat taaatgttag ttgtttttttagatttttta tggtttaaaa 180 ataaatgaaa agaaaaaagt tttgtttttt tatttaaatttgagttatat tattaaaggt 240 tttttaggta atggggtttt tatacgtttt agagtaagtagtatatggtg tgtgtatgta 300 tgtttttttt tttttttttt ttttttattt tgtgtgtgtgtgtgtgtgtg tgtgtgtgtg 360 tgtgtgtgtg ttagtggaga gagagagaga cgaagaaaagggaggagtga taattttttt 420 aaacgtatat aagttgtttg tgagaaaaat agtagtaattataatatatt aagtttttta 480 ttgttggtaa tgttttttat gtgttttttt agattgtttaattttaattt tttaaatgtt 540 ttattttttt ttttatattt tggaaaatta taatatgttgatttaattta aaaaagttat 600 ttgaaatgta gttaaattta tttgattttt tttaatttattattgtatat gggttttatt 660 ttattttatt agtaaatttg atattgatta tgataaatttatttagtgtt atatattttt 720 atttgtaaat tttaaggttt aattttaaat tttttagggtaagaggtttt taaaatattt 780 ttaatttgta ggatttttaa gattttattt ttaaatgttttaatatgatt aattttatat 840 atgtgatttt atatttttat attagatata aaaaagatttagattattta ggtttttagt 900 tagttttttt tatatatgaa gttattttta cgagtaagatgaaggggaag tgagatagtg 960 gtagttgttg ttttttggat gataggttaa tttattttttgtttttaaag gaagtaggtt 1020 ttatttttta aatttttttt attatatgtt tttgtatgtattgttttttt ttattagtaa 1080 gtttttttga ttttttttgt tttttttttt ttttttatttttttttttgt ttgattgttt 1140 ttttgatatt atttaaagat aattgttttt tttttttggttttagaatta ttcgatgttt 1200 tttagtagtg aggttagttt ttataaatgt ttaattaaaaaaaatttttt ttaaaatagg 1260 taagaggagg aggagttgaa ttttaaatat ttggagttttttttgattag tagtatttaa 1320 tttttgatag tatttaattt atggtatttt agtgaagataattttaaaag ttaatagaga 1380 agttaggtta attttttcga taggatgata tatttttttgtaaattttta aatgtttttt 1440 attgtattat ttgtgagtag ggattagtag tgtttttaaataggaagtgt gttttttgtt 1500 aatagtaagt tttatagatt tttggttttt ttgtttagtggagggttatt aagagagagt 1560 atttaatttt ttatagttgg aaattttttt ggtttttttagattatgtaa ttttttaaaa 1620 tgttataggg tagattaagt tttgaatttt atttgtgtttttgattaggt tttagtttgt 1680 tttatagatt attgtatttt ttgttttttt ttgtgttttttttatagtgt aggtagtaat 1740 tataatattt tttatagagt gtattatttt gtttttaaggatgttagaaa cgtatggtat 1800 cgatttttat tgtgtattta gataatagta atataagtatagaatattat tttggtatta 1860 tagaagtttt ataattttta agtgttagta gtatattttttttaaacgtt agtaatttta 1920 atttttggta agaaaaaaaa tagattatgt aatttataatgattttattt tttagtaaaa 1980 ttttattttt ttgtgttcgt tattagaaat ttttatagatatattttagt agttatattt 2040 ttgtttgttt agttagagta agtttagtga ggaagggggtttgttgttat ttttttttaa 2100 tgatggaaat attgaggagt atatgaggaa ttttatttattagatgtgtg aggttaagag 2160 atttttgatt atgttattgt tttttagttt gggcgatagagtgagatttt gttttaaaaa 2220 aaaaaaaaaa tgatatgttt atttattaaa aatttttgttagattatttt tttttataaa 2280 tttttaaatt ttttaatgat ttaataagtt ttatttttattattgttaaa aaaatttttt 2340 ttttgagtaa tataattata aagtaaagaa tgttattattgatttaatta gtaaaaaaat 2400 aatatttaat aataaaattt tttaaatatg gttttaggttatttagatga tttagttatt 2460 tttttttgat gttttttttt ttttcgaatg aattataatgaggtagaaaa atttttatgg 2520 gtgtagagta ggtgtatata tttatggagt atgtgagatattttgatata ggtatataat 2580 atgaaataag tatattatgg agaatggggt atttatatttttaagtattt attttttgag 2640 ttataaataa tttaataata ttttttaagt tatttaaaaatatatagtta tgattgatta 2700 tagttatttt attgtgttat taaatagtag gttttatttatttttgttaa tttttttgta 2760 tttattgatt atttttattt ttttattttt tttagatatttattattttt tttagttttt 2820 atttttttat tttttatgtt tataagttta attgttttgaggtttagatt ttataaataa 2880 gtgagaataa gtgatgtttg tttttttgtg tttggtttattttatttaat agaatgttta 2940 gttttattta tgttggtgta aatgattgga ttttattgttttattgtatt ttgtatatgt 3000 attatatttt tttaatttat ttatttattg atgaatatttaggttgtttt taaattttag 3060 ttttgtaaat agtgttgtaa taaatatagg agtgtagatatttttttaat atattgattt 3120 tttttttttt gggtatatat ttagtagtgg gattgttggattatatagta gtttaatttt 3180 tagttttttg aggaaatttt aaattttgtt ttatagtggttgtattaatt tatattatta 3240 ttaacgttgt atgagggttt tttttttttt atatttttgttaatattttt tattgtttga 3300 attttggata taagttattt taattggggt aagagggtattttataatag ttttgatttg 3360 tattttttta atgattaata atgttgagta tttttttataagtttgtttg ttatttgtat 3420 gttttttttt gataaatgtt tgtttaaata ttttgtttatttttttattg gattattaat 3480 ttttttttat agaatttttt gagtttttta tatattttggatattaattt tttgttaaat 3540 gggtagttta taaatatttt attttatttt gtgggttgtttttttatttt attgattgta 3600 ttttttgttg tgtagaagat ttttaattag atgtgattttatttgtttat ttttgttttg 3660 gttatttgtg tttgtgtggt attgtttaag aaatttttgttaagattaat gtttttaaga 3720 ttttttttaa tgttttttta ttgtagtttt atagtttgaggttttagatt taaatattta 3780 attaaattat tttttatttg atttttgtat atggaacgagatagggattt agttttattt 3840 ttttgtatat gggtatgtag tttgttagta ttatttattaaaaagattgt ttttttttta 3900 gtgtatgttt ttggtatttt ggtgaaaaat gtttttattgtaggtgtgtg attttgtttt 3960 tgggtttttt tgttttattg ttttatgtgt ttgtttttaggttagtatta tgttgttttt 4020 gttattatta tttcgtagta taatttgaag taaagtaatatgattttttt agttttgtta 4080 tttttgttta ggataatttt gtttttttaa ggtttggtgttttatataaa ttttaggatt 4140 ttttttttgt ttttgtgaag aatgtttttg gtattttgataggaattgta ttgaatttgt 4200 agattgtttt aggtaatacg gattttttaa taattttgatttttttaatt tatgaatata 4260 taatattttt ttattatttg gtgttttttt taattttttttattaatgtt ttgtagttat 4320 tattatagag attttttatt tattggttaa tttttaggtatttaatttta tgtgtggtta 4380 ttgtaaatgg gattattttt ttattttttt tttatattttttattgttgg tatatggaaa 4440 ttttgttgat tttggtatgt tgattttgta ttttgtaattttattgaatt tgtttgttag 4500 ttttaatagt tttttagagg agtttttagg ttttatttaaatataagatt ttattattag 4560 taaataagga taatttgatt tttttatttt taatttggatgttttttata tttttttttg 4620 tttggttgtt ttagtaaggt aatatgttga ataatagttgaataatagaa taaaaaaaaa 4680 tttttgtaaa gtaaataaat tttattagtt tatttgatttgtattttaaa ttagtgtttt 4740 tggttttttt ttaaaatttt aagtattata aggaaattagttggaaggga attatgtgtt 4800 gattaagttt ttaaagggta gaaatattta ttgaagtgaaaaggattagt aaagggtgga 4860 aaaaaagatt agtttttcgt ttagtttggg tgagtagatttgggattaat tattaggtag 4920 taatttatat gtatttaata gttttgacgt gagaggataagaaatataag taaatataaa 4980 atatttaatt ttaagagaag tttattagag atattttttaggattgtgag gtattggaaa 5040 gaagttttat ggggagtggg tggatacgtg ttaaaattttattagtgtaa gggattttaa 5100 attatagaaa ttaatttgtt ggaaatttgt ttttaattttttttttagtt ttaaggttaa 5160 attaaatgta attaatgatg gtgatttgtt aatttatgtttttgataatt gatatttagt 5220 atgtatatat atataaataa aatgacgagg atagggaatttaattatttg ggtattatat 5280 atgtaggtgt tatatatgtt aaattttaaa ggtaaaatttgtgtgaaatg ttatattttt 5340 attatttgtg tgaaatgtta ttttatatat gggttttattttgaaagtgg tttgggaagg 5400 gggtatatta ttttaagtat taagaaaaat ttgtataattttattttatt tttttttttt 5460 tagt 5464 38 5464 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 38 gttgaaaaag agaaagtaaaatgagattat gtaagttttt tttggtattt aaaatggtat 60 gttttttttt taaattatttttaaaatgga atttatatgt aaaatgatat tttatataaa 120 taataaaagt gtgatattttatataaattt tatttttaaa atttggtata tataatattt 180 gtatgtgtga tatttaaataattaaatttt ttgttttcgt tattttgttt atatatatat 240 atatattaga tattagttattaaaagtatg aattagtagg ttattattat taattatatt 300 taatttaatt ttggagttgaaggaagaatt gggaatagat ttttagtaag ttaatttttg 360 tgatttaaag ttttttatattaatggagtt ttggtacgtg tttatttatt ttttatagga 420 ttttttttta gtattttataattttgaagg atgtttttga tgaatttttt ttagaattga 480 atgttttata tttgtttgtgttttttgttt ttttacgtta gaattgttaa gtgtatgtgg 540 attgttgttt gataattaattttaaatttg tttatttaaa ttaggcgggg ggttggtttt 600 tttttttatt ttttattaattttttttatt ttagtgaata tttttgtttt ttaaggattt 660 gattagtata tgatttttttttaattgatt tttttgtgat gtttaaagtt ttaagaaaag 720 gttagaagta ttaatttggaatataagtta gataaattag tgagatttgt ttattttgta 780 gagatttttt tttattttgttatttaattg ttatttaata tattattttg ttagagtaat 840 taggtaagag aaggtataaagagtatttaa attggaaatg aagaagttaa attatttttg 900 tttgttgatg ataagattttatatttgaat aaaatttaaa gattttttta aaaaattatt 960 agagttgata aataaatttagtaaagttgt aggatataaa attagtatat taaaattagt 1020 aaagttttta tatattaatagtgaaaaatg tgaaaaagaa ataaaaaagt aattttattt 1080 ataatagtta tatataaaattaaatattta ggaattaatt aatgaatgaa aggtttttat 1140 aatgataatt ataaaatattgatgaaagaa attgaagaag atattaaata atggaaaaat 1200 attatatgtt tatggattgggagaattaag attgttaaaa agttcgtatt atttaaagta 1260 atttatagat ttaatgtaatttttattaaa atattaaaga tattttttat agaaatagaa 1320 agaaaatttt aaaatttatatggaatatta aattttgaag aggtaaagtt attttaagta 1380 aaaataataa aattggaggaattatattat tttattttaa attatattac ggagtgatag 1440 tagtaaaaat agtatggtattggtttaaaa atagatatat agagtaatgg aataggagaa 1500 tttaaaaata aaattatatatttatagtaa agatattttt tattaagata ttaagaatat 1560 atattgggga aaagatagtttttttaataa atggtgttgg taaattatat atttatatgt 1620 aaaagaatga aattaggtttttatttcgtt ttatatataa aaattaaata aaaaatgatt 1680 tgattaaata tttaaatttgagattttaaa ttatgaaatt ataatgaaga aatattgagg 1740 aaaattttga ggatattggttttgataaag attttttgag taatattata taagtatagg 1800 tagttaaagt aaaaatgaataaatgggatt atatttagtt aaaaattttt tgtatagtaa 1860 agagtataat taatgaagtgaagagataat ttatagaatg ggataagata tttgtaaatt 1920 atttatttga taagggattaatatttagaa tatatgagaa gtttaaaaaa ttttatagaa 1980 aaaaattaat aatttaataaaaaaatgggt aaaatatttg agtagatatt tattaaaaga 2040 agatatataa atggtaaatagatttatgaa aagatattta atattattga ttattagaga 2100 agtataaatt aaaattattgtgagatattt ttttatttta attaaaatgg tttatgttta 2160 aaatttaggt aataagaaatgttgataagg atgtggagaa aaggaaattt ttatatagcg 2220 ttggtagtaa tgtaaattagtataattatt atggagtaaa gtttggagtt tttttaaaaa 2280 attaaaaatt gagttattatatgatttagt aattttattg ttagatatat atttaaaaga 2340 aaggaaatta atatattgaagagatatttg tatttttatg tttattgtag tattgtttat 2400 aaagttaaaa tttggaagtaatttaagtgt ttattaatag atgaatggat taagaaaata 2460 tggtatatat gtaaaatgtagtaaaataat gagatttagt tatttgtatt aatatggatg 2520 gaattagata ttttgttaagtgaaataagt taggtataga aagataaata ttatttattt 2580 ttatttattt gtggaatttaaattttaaaa taattgaatt tatggatata aagagtagaa 2640 gaatggaggt tgggaaaggtagtgggtgtt tgaggggagt agggaagtag ggatagttaa 2700 taggtataaa aaaattagtaagaatgaata agatttattg tttgatagta taatagggtg 2760 attatagtta attataattgtatattttta aataatttaa aaagtgttat tggattgttt 2820 gtaatttaaa ggataaatgtttgagggtat gaatatttta ttttttatga tgtgtttatt 2880 ttatgttgta tgtttgtattaaaatatttt atatatttta taaatatata tatttatttt 2940 gtatttatga aaatttttttgttttattgt gatttattcg aagaagagaa gggtattaaa 3000 ggaggataat taagttatttggatggtttg gagttatgtt tgaaaaattt tattgttaag 3060 tattgttttt ttattggttaaattaatgat aatatttttt attttgtgat tgtgttattt 3120 aaaagaagga tttttttaataatgataaaa ataaagtttg ttagattatt aaaaaattta 3180 aaaatttata aaaaagagtggtttgataga agtttttaat gagtggatat attatttttt 3240 tttttttttg ggatagggttttattttgtc gtttaggttg gagagtagtg gtatgattaa 3300 agatttttta gttttatatatttaatgggt aaaatttttt atatattttt tagtgttttt 3360 attattaaag aagagtagtaatagattttt ttttttattg agtttatttt agttgggtag 3420 gtagaaatat gattgttaaaatatgtttgt ggaaattttt aataacgaat ataaaaaaat 3480 agaattttgt tgaagagtaagattattata gattgtataa tttgtttttt tttttgttag 3540 ggattgaggt tgttaacgtttgaagaaaat gtattattga tatttgggga ttgtagagtt 3600 tttatggtgt taagataatattttgtgttt gtattgttat tatttaaatg tataatggga 3660 atcgatatta tgcgtttttaatatttttaa gggtaaggta gtatatttta tgaaggatat 3720 tgtgattatt gtttgtattgtggaaaaagt atagaaggag ataagaaata taataatttg 3780 taaaataaat tgaagtttaattaaaagtat aggtaaaatt tagaatttgg tttattttat 3840 aatattttga agaattatatggtttagaga aattaggaaa atttttaatt gtgagaaatt 3900 aagtattttt ttttagtaattttttattaa ataggaaaat tagagattta tgggatttat 3960 tgttggtaaa aaatatattttttatttagg aatattgttg gtttttattt ataaataatg 4020 taatgaaaag tatttaaagatttataaagg agtgtgttat tttatcggaa agattggttt 4080 gatttttttg ttaatttttagaattgtttt tattaaaatg ttataaattg ggtattatta 4140 gaaattaaat attgttaattaaaggagatt ttaggtgttt ggaatttaat tttttttttt 4200 tttgtttatt ttaaggaaaattttttttaa ttaggtattt gtggaagttg attttattat 4260 taaaggatat cgaataattttgagattaga aaaaaaaaat agttattttt gggtaatgtt 4320 agagaaatag ttaaatagagagagagatag agagagaggg agagatagag aagattagga 4380 gaatttattg atgaaaggaaatagtatatg taagaatata tgatggggga ggtttaaagg 4440 gtaaagttta ttttttttagaagtaagaag taaattggtt tgttatttaa aagatagtaa 4500 ttgttattat tttattttttttttattttg ttcgtaaaag tagttttatg tataaaaaga 4560 attaattgaa agtttaaataatttaaattt tttttatatt tgatatagaa atataaaatt 4620 atatgtataa gattggttatattgaaatat ttagaaataa ggttttggaa attttatagg 4680 ttgaaaatat tttaaaaattttttatttta aaaagtttaa aattaaattt tgaaatttgt 4740 agatggagat gtgtggtattggatggattt attataatta gtgttaaatt tattaataaa 4800 atgggatgaa atttatatgtagtgatgaat tgaggaagat taaatgagtt tggttatatt 4860 ttaaataatt tttttaaattgaattagtat attataattt tttagggtat agaggaggag 4920 atgagatatt taagaagttaaaattaggta atttggagag atatatgaaa agtattatta 4980 gtagtaaggg atttggtgtgttatgattat tgttattttt tttataagta atttgtatac 5040 gtttagaagg attattattttttttttttt ttcgtttttt ttttttttta ttgatatata 5100 tatatatata tatatatatatatatatata tatagaatga gagagagaga gagagagaga 5160 aatatgtatg tatatattatatgttattta ttttggaacg tataaaggtt ttattattta 5220 aggggttttt ggtaatataatttaaattta ggtaagaaaa tagagttttt ttttttttat 5280 ttatttttaa attataggaagtttgaagag ataattgata tttggttaat atttatttta 5340 aggatgtttt tttattttttagataatttt gtagaagata gataatgatg gaaatttttt 5400 gatttttttt atttttttattagaattaaa atttattttt gttttttttt tacgtatttt 5460 aata 5464 39 7479 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 39acggtttggt aagtagagcg aaggaggaaa tttagagttt aaaatatttt gttaattttg 60gaaaagagag aattttttgt ttagtttgtg gaggcgggag ggatagaagg agggagtatg 120tggtttgttg tgagtttttg tatttagggg taagagttag gtttagatag gtgattgggg 180ggtgtatatt tgggtttttt taggggagat ttgatatttt tgttttgtta agaggtttaa 240aagggagata gtatgtatgg gtgttgtagt ttttttgaga cgggttatat aggagtagat 300tattaatata ttaaagaaga gaggatgatt ttagggataa agtatagaag ttattagtaa 360gggtttgttt aaaaaggtgg gggttgtttt taaaattttg aggtagtacg tattaggtga 420gttgatttga aaggtgggtg tcggggtttt tttaggtaaa ggtaaagagg ttttgggaat 480tagggtgtaa aggaattgtg aaaaagtatt atttaggttt agaatagaaa aatgggtggt 540attcgaggga agtgaggaaa gtaaagtata tgggttagaa attattggat atattgggag 600tatagtttgg ttaatgagtt tgaggttttg gattaagtga taagttttat ttggtttttt 660aataggtaga attgatgtgt taaaaggaga gtttgttggg tagagtaggt gattggtgag 720gaggagagaa atgataggtt ttaggtttat gagagttgtt tgggggatga gatattgttt 780ttgtgatagg aacggggtgg gttttttaag ggtgatgtgg atgggggtgt ggtgttttgt 840gatcgagggt gtggaagtat tttaaatagt ggggttaatt ataggtgcgg gataaggaaa 900agttgtatgt tttagggtgg gaggtcggag gagtagaaga aggttagaag tttgttagaa 960gttttggagg ggtttgggtt gatgtgttgg gtattatggg gaatgtggaa gtggagagta 1020gtgtggagtt ttgaaagaat atttttgttt aggagcggag ttgggtatga aggtaggatt 1080aagaaagagt gattgaagga aaaggtgttt agggagtaga aaagtggagg ggggttttgg 1140ggtttggaga tttgtttatt gatttttata atagagattt gggaggattg ggtgggtttt 1200gaaaatttag gtaaagtaga gtaggttgtt ttaatattaa tttttaaaaa atatgtatgt 1260ttatttgtta ttattagagt tatttttggt ttagatgaag taatggtagt tgttgggata 1320tttgttttag ggtattgtta gtttttagtg gtaaggtcga tgagattcga gtaggaggtt 1380ttggttagtt cggaaaggga tggaggcgat ttttgttgga gtcgtttata gtttgatttt 1440tattgagttt tttatagagg gggtatagtt tggtgagtat agttgggttt gggtatggtt 1500tggattagta gtttttattg ttatatttga aataggcgtt aggtggaggt gttttgttag 1560gaggtttttg tatggagttg tggttttgtg ggtttgtagg gtaaaggtaa gtattggaaa 1620ttgttttttt tttttatttt ttttattata attgttaaag attttgaagg ttaaattaag 1680aaggttttat tgtggggttt gagggtcgtt attaattttt tgaagtttgc gttaaatatt 1740atggtagatt gggtgaggaa ttgaaggttt gaaatagtgg ttttttttgg gttggttggg 1800tttaggttgg taattttttt atggttttag ttaaataaga gagaaaaagg gttgggtttt 1860tgttaggatt ttcggtgatt tttgaaagtt ttttatagtt tattatttta tgggtatttt 1920ttttgagttt tgtaaggaga tatataatta tgaggttttg atggttgtgt ttagaggttt 1980tgttttgata attttagtgg gggttttggt tgggaattgt ttttgtgtta gtaggttggg 2040taggagtttg atgatgaatt gtattagtat gtatttgagt tagggtttaa gtacggtgtt 2100ggttttttgg ggtgagggtg gaagagaaga taagtagttg ttatgttagg ttagtttata 2160agattgagta aggtattgaa tttttttaat ataagaggta ggattttttg gaaatgaatt 2220gagttttttg ttagtttgag agagattagt gagggagaag ggaatatgaa ttttaataat 2280atttttagtt tttgttattt ttcgaagggg gtattttagt attggcgtta aagtacgggt 2340ggggtatggg ggttaaagat ggtgtcggag ttagtatggg taggagagaa ggaagaagtt 2400agaaggggtt tttgttgagg gtttgaagag ggaagggggg ttgagttgat aggtattgga 2460ggatagatac gggtgtaagg tggcgggatg ggtttatagg tttcgtgaga gggttgtaag 2520gaaggagaat gagtataggt aatgttagag tttttttgag gagaggatgg tataggaaaa 2580gaagtgggtg atgttggttg ggaagatggt ggttgggaag atggtggttg agaagataat 2640gaggaagttt ggggagttaa tgaagttggt tgagatggag gggtagggtt tgggaggggt 2700ggatagtagt ttgttttatt taatgaggaa aaagaggtag ggtcgggagg ataaaggtaa 2760tgagggcggc gagaatgaag aaggatttga ataggtaagt aagaattgta gaggtcgggt 2820tgtgatttga gtgtaaaaag gtttggatat aaggaatttt tttttatttt tttagttatt 2880tgtaataatt gtttaagtta gttaaaattg taaagttgag tgttttattt gcgggttatt 2940tggattcgtt atttaattta tattgcgatt aggttttatc gtataaaaaa gataaggtat 3000ttatggtaga tattttgttt gaggtttaag gtttgtagat ttttaatgag gtaggttgga 3060gggttgtttt ttggaattga ggatcgggag ttttttataa tgaagggtag ttcgagagaa 3120tagggaaaaa ggagattatt ttggatagtt ggagggagac gataaaagga gttatcgttt 3180tcgttgtttt tttggttttt ggaatgggat gaaatggttt agaggtattt ttttaagatt 3240agatgattag cgagtgtttg gcgtacgttg gcgttttttt ggattagtgt tggatttttg 3300gattggagaa attaagagag gttatgtaga ttttgttttg ttaatcgggt tttaagggaa 3360atttattagt aggcgagatt agtggttgat gcgtatgtat agagaggcga ttggaggttg 3420aggagttttt tttgtttaat tgttgtggtt tgttttttgg ggtggagggg taggtttata 3480agcgatatag atttgagttt tttttaggat ttggtattag atgtaaggtt tttgaattag 3540tttgaatttt aatagcgcgt taatagataa taggaggcgg tgtggagtaa tatgttgttt 3600taatgaacgt ttggttgtag gtgggttgag gtttaaaatg gtattagttt ttagtgagga 3660tgggataggg gttttgtagt tttttgtaaa tagtaagtgt tttagtttgt tgtgattgtt 3720atgtagtatt tggatggttt attttttgat ttttaggggt atattttttt tagttagggt 3780aagtgttttt tggtcggttt tttttttgtt tttgttattt tgttgatata cgttgttgat 3840gtaagtggtt ttgtattttg gggttgggtt tgagaaggga ggagttattt atttttttaa 3900gtttttaggt tttgaggaga atttttgaat tttttgtatt attggttatt tttttgatag 3960atttttgtga tgttaggtag gaatgagtcg tttgggtatt tagagagttt ttagtgtttt 4020tttgttattt tttttatttt tgtattttgt ttggtttggt tttttaattt gatttagttt 4080tatataaagt taggaatttt ttttgttaat agaattttag tttttttagt ggggatgtgt 4140attttggaga gggggattat ttttttttat ttttattgtt ggggtattta tagtgtttgg 4200gatgtttttt aggttttgta ggagtagtac gttttttgta gagggtgtgt ggattttttt 4260agaattgttg gtttgttttt gtagttgatt tgtagttaaa atttataatg taagtttttg 4320tatgttgttt tgtttggagt tgtaatttag ttttgtattt tatttgttat gattattgga 4380aaatttttat ttatttttta aagggtttag aaaatgttaa tttatagaga tagaaattag 4440attagtggtt gtttagggta ggatggatgt aaaattttag agtggggggt tagaggttat 4500tgtatagaat tttttggaga taatattgat tattgtagtg aaagtaaaat tttgtgaata 4560tattaggaaa tattgaattg tatatattaa ttggtgagtt atatggtata tgaattatgt 4620gttaataaag ttttagaaga tattatttgt attacgatat taaaaaatgt cgtttgagtt 4680gtataattat tttttttttt tatgttaagg gtatcgaata ggtaggagtt ttttatttgt 4740tattgttttt aatagtatta taaaataatt atataagata ggttatttat atattttagg 4800ttataaaaat tattgtttga ttagagtaat tgtaaatata aaagaatatt aaatatatta 4860aaataaatat gaggttatta attttttgtt ggtttttttg gtatgtattt atttagattg 4920ttagtattat gtatttattt taaattttag tagttatatt ttaatttgat tgattttttt 4980ttagatataa gtatgagaaa tgatagaaag aaataataat tggaaaagaa gtattgtata 5040agattaggat gtttttgaaa tggacgttag tttttttgtt gatatagttt agttgttatt 5100ttagttttgg aagttgtgga aaggtgttag tgtggtttat agaatatagt tattggataa 5160atatgaagat aattttggaa gagtttgttt agaggggtta tgaggtgatt gtgttgatat 5220tttcggtttt tatttttgtt aatgttagta aattatttgt tattaaatta gaagtttatt 5280ttatattttt aattaaaaat gatttggaag attttttttt gaaaattttc gatagatgga 5340tatatggtgt tttaaaaaat atattttggt tatatttttt ataattataa gaattgtgtt 5400gggaatatta tgattatagt aataagtttt gtaaagatgt agttttgaat aagaaattta 5460tgatgaaatt ataagagtta aagtttgatg ttattttggt agatgttttt aatttttgtg 5520gtgagttatt ggttgaatta tttaatatat tttttttgta tagttttcga ttttttgttg 5580gttatatatt tgagaagaat ggtggaggat ttttgttttt ttttttttat gtatttgttg 5640ttatgttaga attaagtgat taaatgattt ttatggagag gataaaaaat atgatatata 5700tgttttattt tgatttttgg ttttaaattt atgatttgaa gaagtgggat tagttttata 5760gtgaagtttt aggtaagtta tgtgtttaat tggtgtttat taagttttaa tttttttgtg 5820tttttgaagg tgagtttata taaatataat gttagaagat agtgttttta agggaaatta 5880tgaattgtaa atgtaagatg atttattagt tttaaaaata ttatagaatg ttgattttat 5940agaattagtt agaattttgg ggttattatt attataggat atttagagag ttataaattt 6000ttattgtaaa gtattaatga tttttttaaa ttattatata ttattttgtt atatattttt 6060ttatttttaa aaaaagttaa tagatatttt aagaaatatt tttatgaagg tagatacgta 6120aatttagtat ttatatatat ttttagaaaa attattaatg taggattgag gaatttgttt 6180ttttttgagt tttttagttt ttttatttag aaattaaatt ttgtttttta tgtaagaagg 6240atttttttat agttgagtaa tatagtggtt ttattttaga aatagaagtt taaaatttga 6300gatttttaat gtttatatat ttttttaata ataggttgat aattattttt tttaaaaatt 6360gaaattttgt tgaaagtgaa tatttaagtt ttaatttata ttttattaaa ttgtattttt 6420ttattaaaga aaataggggt taaattaagg gagagtatat atttttatgt taataaattt 6480tgaaaatgtt ttaattttta tttgtaaata tatttatttt aaaaatttaa ttatattaag 6540attttaagat gaattaagat agtagtaggt gtaaagattt tagtgttgag tttaaaaaat 6600ttatggttta ttttgagaat taaggattaa gggattagtt taataaattg tagatattag 6660agtatttttt ggaaagttgt ttttatgggt aaggtaagat gaattaattg tggaattgaa 6720agagttgttt aaaggtatat ttgttattat tgtagtttta gagggaagat aaatgtgtat 6780ttaagtttat agtggttata ttagtttatt tttatattgt tgtaaagaaa tatttgagat 6840tgggtaattt ataaagaaaa gaagtttaat agatttagtt ttatatgatt gggatgtttt 6900aagaaattta gaattatggt gaaaggttaa ggggaagtaa gtttggattt ttttatttag 6960tggtaggaga gagaagtgta agtaggggaa atattagata tttataaaat tattagattt 7020tatgagagtt tatttaatat tatgagaata gtatggagga atttatatta tgatttaatt 7080atttgttatt gggttttttt ttggatatat ggggattatg gggattataa tttaagatga 7140gaggagattt gggtggggat agttaaatta tattagtgat ttattttaat aattatttat 7200gattgtgaat atattgatgt tatattaaag atgtgatttt tttttataga tttttgaata 7260tattgttttt tttatatata tatatgagta atatatgtaa taaataaaat ttaaattatg 7320attatatata aatgtattta tatatatttt attaatgtat agatatttta tatatgtttg 7380ggtatgttat tttaagtttt tttaggaaaa tatttgtata tttaaataat aattttcgtg 7440ttagttattt tttgttttgt tttgtttttt tttattagg 7479 40 7479 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 40 tttgatggaaaaaaataaaa taaaataaaa ggtagttaat acgagaattg ttatttgaat 60 atgtaggtatttttttgaaa ggatttggaa taatatattt aaatatatat aaaatgtttg 120 tgtattgataaaatatatat aaatatattt atatatagtt ataatttaga ttttatttat 180 tgtatatgttgtttatatgt atatataagg aaggtaatgt atttagagat ttgtaagaag 240 aaattatatttttaatgtaa tattagtata tttataatta taaataatta ttaaaataag 300 ttattaatatggtttgattg tttttattta aatttttttt tattttgaat tataattttt 360 ataatttttatgtgtttagg gagggattta gtggtaggtg attggattat ggtgtggatt 420 tttttatgttgtttttatga tattgagtga gtttttatga gatttgatag ttttataagt 480 gtttggtattttttttgttt gtattttttt tttttgttat taagtgagaa gatttaagtt 540 tgtttttttttagtttttta ttatgatttt aagttttttg aggtatttta gttatgtaga 600 attgagtttattaaattttt tttttttata aattatttag ttttaggtat ttttttatag 660 tagtgtgagaatggattaat gtagttatta tgaatttaaa tatatatttg tttttttttt 720 gaagttgtaatagtaataaa tatattttta aataattttt ttagttttat aattaattta 780 ttttattttatttatgaaaa tagtttttta ggaagtattt tagtgtttat agtttattaa 840 gttagttttttgatttttgg tttttaaagt aaattatgag ttttttgagt ttaatattga 900 aatttttatatttattattg ttttggttta ttttaagatt ttaatataat tagattttta 960 aaataaatatatttataaat gagaattaaa atatttttag aatttattga tatagagata 1020 tgtgtttttttttaatttgg tttttatttt ttttgatgga gagatgtagt ttaataaaat 1080 atagattaaaatttagatgt ttatttttaa taagatttta gtttttgaaa gaaataattg 1140 ttaatttgttattgaaggaa tgtataaata ttagaaattt taagttttag gtttttgttt 1200 ttggagtagagttattatat tatttaattg tgaaggaatt ttttttatat gaaaaataaa 1260 atttaatttttaaatgagga aattgaggaa tttaaagaga aataaatttt ttaattttgt 1320 attgataatttttttagaaa tatgtgtaaa tattaaattt acgtgtttgt ttttatgaag 1380 atgttttttgaggtatttat tgattttttt taaagatgaa aaaatgtata gtaaaatgat 1440 atgtgatagtttaaagaaat tattagtgtt ttataatgaa ggtttatgat tttttgggtg 1500 ttttgtagtagtgatggttt tagggtttta attgatttta taaggttaat attttataat 1560 atttttgagattgatagatt attttatatt tgtaatttat aatttttttt aaaaatatta 1620 ttttttgatattatatttat ataagtttat ttttaaaggt atagaaaagt tagaatttaa 1680 taagtattagttagatatat gatttattta gaattttatt ataaaattgg ttttattttt 1740 ttagattataaatttgaaat taaaagttaa aataaagtat atgtattata ttttttattt 1800 tttttatgaaaattatttga ttatttaatt ttgatataat aataggtata taggaaggag 1860 ggaatagaaattttttatta ttttttttaa atgtgtagtt aatagagaat cgaagattgt 1920 atagaaagggtatgttaaat agtttagtta gtagtttatt atagggatta agggtatttg 1980 ttagaatgatattaaatttt gatttttgta gttttattat aagtttttta tttaaaattg 2040 tatttttatagagtttgtta ttgtagttat aatattttta atataatttt tgtaattgtg 2100 aaaaatatgattaaaatgta ttttttgaaa tattatatat ttatttatcg agaattttta 2160 gaagagaattttttaaatta tttttagtta aagatgtagg ataaattttt aatttaatag 2220 tagatgatttattggtattg ataagagtag aagtcgaaga tgttaatata gttattttat 2280 gatttttttgaataagtttt tttaggattg tttttatatt tatttaatgg ttgtattttg 2340 tgggttatattagtattttt ttatagtttt tagagttaaa gtaataattg agttgtatta 2400 gtagaaagattgacgtttat tttagagata ttttggtttt atgtaatgtt ttttttttag 2460 ttgttgtttttttttgttat tttttatatt tatatttgag gaaaaattaa ttaagttaaa 2520 atataattgttaaaatttga agtaaatata taatattaat agtttgaata ggtgtatgtt 2580 aaggagattaataaaagatt gatgatttta tatttatttt agtgtgtttg gtgttttttt 2640 atgtttataattattttagt taagtaataa tttttatgat ttagaatatg taagtaattt 2700 gttttatgtaattattttat aatattgtta agaatagtgg taagtgagag gtttttgttt 2760 gttcggtgtttttgatatag agagaagaag taattatata atttaaacgg tattttttaa 2820 tatcgtggtgtaagtaatgt tttttaaaat tttgttgata tataatttat atgttatatg 2880 atttattaattagtgtgtat agtttaatgt tttttagtat atttatagaa ttttattttt 2940 attataataattagtattat ttttaaaaga ttttatataa tagtttttaa ttttttattt 3000 tgaaattttgtatttatttt attttaggta attattaatt taatttttat ttttatagat 3060 tagtattttttggatttttt aaaaaataaa tgagggtttt ttagtgatta tggtagatgg 3120 gatgtaggattagattgtag ttttagatag agtagtatgt agaggtttgt attgtgaatt 3180 ttagttgtagattaattgta agaatagatt agtaattttg agaggattta tatatttttt 3240 gtaggaagcgtattgttttt gtaggatttg ggagatattt taaatattgt gagtgtttta 3300 ataatggaagtgggaaaggg tgattttttt ttttagaata tatattttta ttggagaagt 3360 tgaagttttgttggtaggag aagtttttga ttttatgtga agttgagtta aattagagaa 3420 ttaagttaagtaaaatatag gggtagagga agtagtagaa aggtattggg agttttttgg 3480 atatttaagcggtttatttt tgtttggtat tatagggatt tattaggagg gtggttagtg 3540 atgtagggggtttaaagatt ttttttaggg tttgaaggtt tgaagggatg agtaattttt 3600 ttttttttaggtttagtttt aagatgtaag attatttgta ttagtagcgt gtgttagtaa 3660 gatagtagaagtaggaagag agtcggttag aagatattta ttttggttgg aagagatgta 3720 tttttgaagattaagaaata ggttatttag gtattatata gtagttataa tagattggga 3780 tatttattgtttatagagga ttataaaatt tttgttttat ttttattggg ggttgatgtt 3840 attttaggttttagtttatt tgtaattagg cgtttattaa aatagtatgt tgttttatat 3900 cgttttttgttgtttgttgg cgcgttgttg gggtttaaat tgatttaaga attttatatt 3960 tggtgttaaattttaggagg ggtttaggtt tgtgtcgttt gtggatttat ttttttattt 4020 tagagagtaggttatagtaa ttagatagag gaagtttttt agtttttagt cgtttttttg 4080 tgtatgcgtattagttattg atttcgttta ttggtaagtt ttttttggag ttcggttaat 4140 agggtaaaatttatatggtt ttttttggtt tttttagttt aaaaatttaa tattgattta 4200 agaaggcgttagcgtgcgtt aggtattcgt tggttatttg gttttagggg gatgttttta 4260 agttattttattttatttta ggaattaaaa aggtagcgga gacgataatt ttttttatcg 4320 tttttttttagttgtttagg atggtttttt ttttttttgt tttttcgagt tattttttat 4380 tatgggaaattttcggtttt taattttaaa aaatagtttt ttagtttgtt ttattaaaaa 4440 tttgtaaattttaggtttta ggtaagatat ttgttataag tgttttgttt tttttatacg 4500 ataaagtttggtcgtagtat gaattagata acgggtttaa atggttcgta aatggaatat 4560 ttagttttatagttttaatt gatttaagta gttattgtag atgattggga aaatggggag 4620 aaattttttgtgtttaggtt tttttgtatt tagattatag ttcgattttt gtaatttttg 4680 tttatttgtttaaatttttt tttattttcg tcgtttttat tgtttttatt ttttcgattt 4740 tatttttttttttttattgg atggagtaga ttgttgttta ttttttttag attttatttt 4800 tttattttaattaattttat taatttttta agttttttta ttgttttttt agttattatt 4860 tttttagttattattttttt agttagtatt atttattttt ttttttatat tatttttttt 4920 ttaggaaaattttagtattg tttgtattta tttttttttt ttatagtttt tttacggagt 4980 ttgtaaatttatttcgttat tttatattcg tatttatttt ttaatgttta ttaatttaat 5040 tttttttttttttttaaatt tttagtagga attttttttg gttttttttt ttttttttgt 5100 ttatattagtttcggtatta tttttggttt ttatgtttta ttcgtatttt agcgttagtg 5160 ttagaatgtttttttcggga agtagtagga attgaaggta ttgttagagt ttatgttttt 5220 tttttttttattgatttttt ttaaattaat aaaagattta gtttattttt agaagatttt 5280 attttttatattagggagat ttagtatttt atttagtttt atgaattaat ttggtatgat 5340 agttatttattttttttttt atttttattt tagaagatta gtatcgtatt tggattttag 5400 tttaggtgtatgttaatata atttattatt aagtttttgt ttagtttatt ggtatagagg 5460 tagtttttaattaggatttt tattgggatt attaagatag ggtttttgga tatagttatt 5520 aagattttatgattatgtgt ttttttgtag gatttaaaaa gggtgtttat aaagtggtaa 5580 attatgaaaaatttttagaa attatcgaag gttttgataa aaatttagtt tttttttttt 5640 tttgtttaattgaagttatg agaaaattat taatttggat ttagttagtt tagaaggaat 5700 tattattttaaatttttagt tttttattta atttattatg atatttggcg taagttttag 5760 aaggttgatgacggttttta aattttatag tgggattttt ttaatttagt ttttaaagtt 5820 tttaatagttgtgatgagga aagtaaaaga aaaaaatagt ttttaatgtt tgtttttatt 5880 ttgtaggtttatagggttat agttttatat agaagttttt tagtaaaata tttttatttg 5940 gcgtttgttttaagtgtggt aatgaaggtt attggtttag gttatgttta aatttagttg 6000 tgtttattaggttgtgtttt ttttgtggag gatttagtga aagttaggtt gtgagcggtt 6060 ttagtaaggatcgtttttat tttttttcga gttggttaaa attttttatt cggattttat 6120 cggttttgttattgaagatt gatagtgttt tggaatagat gttttagtaa ttattattgt 6180 tttatttgagttaagggtaa ttttgatggt ggtaggtagg tatgtatgtt ttttaaaaat 6240 taatattggagtaatttatt ttgttttatt taaattttta ggatttattt agttttttta 6300 agtttttgttgtgggaatta atggataagt ttttaaattt taagattttt ttttattttt 6360 ttgttttttgaatatttttt tttttagtta ttttttttta gttttgtttt tatgtttagt 6420 ttcgtttttaggtagagata tttttttaaa attttatatt attttttatt tttatatttt 6480 ttatagtatttaatatatta atttagattt ttttaaggtt tttaataggt ttttaatttt 6540 tttttattttttcgattttt tattttgaaa tatgtaattt ttttttattt cgtatttgta 6600 gttaattttattgtttggga tatttttata ttttcggtta tagagtatta tatttttatt 6660 tatattatttttaaagagtt tatttcgttt ttattataga agtagtattt tattttttaa 6720 gtagtttttataggtttaaa gtttattatt tttttttttt ttattagtta tttattttgt 6780 ttaataaattttttttttaa tatattagtt ttatttgtta aaaagttaga tggaatttat 6840 tatttagtttaggattttag gtttattaat taagttgtat ttttagtgtg tttagtagtt 6900 tttaatttatatattttatt ttttttattt ttttcgaata ttatttattt ttttgtttta 6960 aatttaaatgatgttttttt ataatttttt tatattttga tttttaaaat ttttttgttt 7020 ttatttgggaaaatttcgat atttattttt taggttagtt tatttggtgc gtattatttt 7080 aaggttttagagatagtttt tatttttttg gataggtttt tgttagtaat ttttgtattt 7140 tatttttaaaattatttttt tttttttaat atgttaataa tttgtttttg tgtagttcgt 7200 tttaaagagattgtaatatt tatatatatt attttttttt taaatttttt ggtagaatag 7260 gggtattaggttttttttaa gaaagtttaa atatgtattt tttagttatt tatttaggtt 7320 tagtttttatttttgaatgt aagggtttat aatagattat atattttttt tttttgtttt 7380 tttcgtttttataaattaag taagaaattt tttttttttt aggattagta ggatatttta 7440 agttttgggttttttttttc gttttattta ttaaatcgt 7479 41 5857 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 41 aattaaaaaa ttaaaattaaaaaggagggt gagatagata tgataaggat tatatggtga 60 gttagaattt agatttttcgataaggttta gttgtttttt tntatagttg ttattatttt 120 ttttttttaa agttttgaaaattatatttt tttggaggtt agtttgggta gtatatagag 180 attttttttt tataaaataaaagtaaagta attagttggg tatggtggtt tatgtttgta 240 gttttagtta tttaggaggatgaggtggga ggattgtttg gatcggngga aggttaaggt 300 tgtantaant tatgattttgttatatcgta ttttagtttg ggttatagag tgagattttg 360 ttttaaaaat aaaataataataataaataa ttttatattt tttaaatgtg tttaataatt 420 agatttttta ggttagtagattttaattag ggaatatttg gtaatattaa gagatatttt 480 tagttgttat aattagaggggaggagtcgt ggtattattg gggtttagta agtagaggtt 540 agggatattg ttaagtattttataatgtat aggataatgt ttttattttt atttcgtaat 600 aaagaattat ttagtttaaaatgttagtgg tgttaaggtt gaganaattt tattttangt 660 tatttggttt tgatttttgtttttaggtat gtggtttgtt tttaaaaata ttatttatta 720 aggaaatatt tttttttttttttttttgag atggagtttt gttttgttgt ttaggttgga 780 gtgtaatggt acgattttggtttattgtaa ttttcgtttt ttaggtttaa gtgatttttt 840 tgttttagtt ttttgaatagttaggattat aggagtatgt tgttatattc ggttaatttt 900 ttgtattttt attggagatagggttttatt atgtcggtta ggttggtttc gaatttttga 960 ttttaagtga tttatttattttggtttttt aaagtgttgg gattataggc gtgagttatc 1020 gtgttcggtt attgatgaaatttttcgaat gaaaagnatt ttttggtttt tattttttga 1080 attatattgt tanggaagtttttttttttg tttagtttta attttttttt tttttagttg 1140 aagagtattt ttcgttgtttagttatattt ttttaaaaat agagagatga ggggtttggt 1200 tttcggttaa gttttaattttgtttgaata gagatttagt ttttttgttg ttttgatgtt 1260 gtgatatttt attttttttcgttgtttgtt tttttnttgt gtgtacgtat gtgttttgtg 1320 tgtttttttt tattttttaggtttttaggt tttgatttgg tttttttgat tttttgtttt 1380 gataagaata aagtttattttaattcgatt ggtttagttt tttgtttcgt taatttgatg 1440 aagttttttt ttttcggtatgggttttatt tttcgtaatt gttttttaaa ttcgggattt 1500 tttttttttt cggttagttttaggttatta tttcggaagg attcggaagt ttttaaggtt 1560 tttttattgt tattcgagttatggtagcgt attttattat tagaagagtt tgtgtttttt 1620 tagagttttt tgnatggtnttgagggtttt atttttgttt tattttatta tagagattag 1680 tgttttnggn tggtaggtttttttttaggt tttttgagat ggggntatng gannggggtt 1740 tttttttttc ggttttcgagtatttttttt tatttattgt gttaaagttt tgggtttttt 1800 ttttgatggg tatcggtttttttgaacgtg atgggatttg ttttttttat tagtagttgg 1860 gtagtttata atttatatttgtgtatttgt tatatttttt atttggtgga aaatatttag 1920 aaggttttga gttttttatttttgggtgtt agtttaaatg attgtatagg aggtntttta 1980 tttttgttat agagtaagttggttatgaac gaaggagaga agacgttata gatttttttt 2040 tttttttttt aggagattataagatagatt ttnttatttt tttagtttta tttttatgtt 2100 ttttttttat tggaggagttgattaaagta gttttaacgg gttataatat ttgattaatt 2160 tagttgttgg tagagggaggaaataagtgt ttttttaagt ggtattttta tttcgttttt 2220 attttgatta aagattgttttaagtagtag tttagttcgt ttagttttag gtgggtagtg 2280 gggnaggaga gttggtatttttttaggtgg taaatggcga ttttatattt ttcgttcgtt 2340 ttagggttgg atggattagaaaaatgttta ttttttttgt atcgatgtag agattttatt 2400 tttttttaaa gatattatttttgtagttgt ttgaagtttg tatatttttt ngtattgtag 2460 agtttatata aaattgaagaatgttaatgt tcgagttttt ttattttgtg tttagaggtt 2520 gttttttgta gattttggtgttaatagatt aaataaataa ataaatattt ttagtagttt 2580 gaagttttgt taaatatttggggaaggagg agtggggtag agattaaggg tatatattga 2640 ttattttatt tttgtttttaagagaaggag ttttaatttt tatatttggg tgttgttatg 2700 gttgtatata gagtttttgttttttggata ttatgtttgt atattttata tggatatata 2760 aataatagat ttatgaaaaggttgtttaga atgaagangg gtggtttgtt ttagaggtgg 2820 ggtgagggag tntattggggaagttattta tttttgtatg agtttgaaaa agttttttaa 2880 ggagaatgga ttttagaaaggaaaagtagg tgattaaggg aagatagttt gatattgntg 2940 ggtgtttttt gtattggttggattttttga tagttttggg gaagttttgg tttattttag 3000 ggagtattta taatatagtgtgtagtttta aagggaataa agaaattata taaagatatt 3060 atttttattt tttcgtagtttttataatgt tgtatttgta agagttttta ggtttttggg 3120 gaaaatggga ataattattttaatatttta atgatgtttt ggaattttcg aagtattttt 3180 ataaaangat atatnttttattgtatgggt gaatagttga ttattttaag ggtagttata 3240 ataagtataa ttgtatttgttttataagat ttgataataa atttttaaat taggttattt 3300 taattattat ttattgggttggtaagaatt agttattatg ttaagtgttt tatataaagt 3360 gttattgaaa tatgataattatttagtaag agaaatatgg taagttttat tgtataatta 3420 ggaaaggata aatagatcgaataatttttt ttaaaagata tagatatgaa gtgggagagt 3480 taggattgga aatttgattatttgaattta gtgtttatgt ttttaattat agcgtttttt 3540 tgtttgttat tatatttttattaattttac gtgaggaaat tcgatttagg ataagcgaat 3600 tgtttgaggt tttagttggtaaagaagtag agttggtagg tttttttttt tagttatttg 3660 gtgttttggt atcgcgggttgagttagtag agtaagttag tgagtaagag agtaaatgta 3720 tnggggtttt tttatgttattaatatcgag gagatagtgg gttggggata ttttattttt 3780 tattttttat ttttttttttaaaagatttt tggttttttc gtaaagtttt attgagttag 3840 gttcggagcg atgggntgtggtgttgttta gtattttttt tttttgtttg aggttgtgtt 3900 aaaagagtag gttgttagaagaggagtttc gatttagaga gtagtttaga gtttattagg 3960 tggtncggag atttgggttnnaattaagnt agggggttgg aggtagtagt aggaagattt 4020 gaggttagtt ttgttttggtaattcgtgtt agtaagtgaa gatttaatat ttgtatgagg 4080 aagggattta acgaggagtttattaatggg aaatatttag gagcgcggtc gaagggtttg 4140 cgttattgtt ggtgagttgttaagatttgg aagaaaattg attttagtaa gtttttattt 4200 ttatttttcg atgtgaggaaataagattag ggttgataaa tagtgatgat taataatatt 4260 ttaagtttgt atagtatattttatagttta taaaatattt ttatttgatt tttataatag 4320 ttaagaggcg ataaggtggttattattaat tatttttagt ttttagattt ggaaaatttt 4380 ggtttagaat ttgggtgatacgggtaggtt atttcgtttt taagtgatta agtcgagatt 4440 tattgtgtcg tttttttttttggaagttta gtgatgtgtt taggtaatga gtaggtaaag 4500 tcgttgacgt tgggtagtagttagacggcg ttgaagtttt agtaaggaat ttggtattag 4560 gatttagtag aagtttggtcgttcgtcgcg gaaaagatta ttggatttgt tttgtcgatt 4620 atattttttt tcgtttcgtttatttgttcg ttttcgtata gcgtagttaa ttggtggttt 4680 ttatattttt atacgttattattttacgtt taggtggttt taggatattt tgtggtgttt 4740 tgggtcgtag ttgtttttagagttgtttga ttggaaaaat ttttagggcg agggattagt 4800 ttcgaggttg tcggtttttttggtttttag ggatggagtt aaggttttan gggcgggttt 4860 ttttttttag gaagtggttgttgggttttn gaggagtttt ttttttggta gttatgagtc 4920 ggtagttttg gtagtgattgttgggttttg ttggatagcg gtcgtatgta gtttttatga 4980 ggtttttgtc gtcggtcggcgatgttcggt tggagttgtc gttttcgtcg tcgttgttgt 5040 cggtgtcggt tgtgagcgggtttttagtcg gtttttttgg gcgttttatg gtttttagta 5100 gttttttggt gttcgatcggttgcgtttgt cgttttgttt tttgggtgtt tttgtttgtt 5160 atttttatta tgggattttgtaggaaaaga tgtgagcgat ttcgggggcg ggtcgatagt 5220 ttttttttag tttgtgatagggatttcggg ttnttttgtt tttggattcg ggtttttttt 5280 ttgttttttt gttcggttgtcgttttttta gtattttatt atttttgtag ttatggttga 5340 gtttatttag aattttagaattttanggan ttattttttg gatttttcgg atttggttat 5400 tttttttttt tagttgttttttttcgtttg gttttaaggg tttgcgtttt ataggttgag 5460 atttttattt tttaaataggattcgagtcg gttttttttt ggtattttta gatgtttgta 5520 aataatttat tcgttttcggttttggtgtt atagtcgaaa tatcgttttt ttttgtttgg 5580 ggtatttgat tttattatttcgttttgtat gttttttttt cgtttttttt ngggtatttt 5640 ttttttaggt tttggaattagtaggttggg atgtttagtt tttagattta gtaaaattag 5700 ttttttttgt aaatgagtttagtggttttt aataaatttt gtttatattt agagaggtaa 5760 gataatttta aagtttttagtggttcggga tatattagat gatagtgagt gaaatatatt 5820 aatttttttt tttttttttatgtattttat ttttaga 5857 42 5857 DNA Artificial Sequence chemicallytreated genomic DNA (Homo sapiens) 42 tttagaaatg aaatgtatga gaaaagagggagaaattagt gtattttatt tattgttatt 60 taatatattt cgagttattg aaaattttaaaattattttg tttttttgga tgtaggtaga 120 gtttgttaag gattattagg tttatttgtaaaaggggttg attttattgg atttagaaat 180 tagatatttt agtttattga ttttaaagtttaagaaaaga atatttngaa aaagacggag 240 aggaaatatg tagaacgaga tagtgaaattaggtatttta ggtaggagga gacggtattt 300 cggttatggt attaaggtcg aggacgaataggttgtttgt aagtatttgg gagtattaaa 360 agggggtcga ttcgggtttt gtttgaggaatagaagtttt agtttgtaaa acgtaggttt 420 ttagaattaa gcggggaaaa atagttaagaaaagaaaata attaagttcg aagaatttag 480 aaaataantt tntggagttt tggaattttgggtaggttta gttatagttg taaaagtagt 540 agggtgttaa gagggcgata gtcgggtaggaggataagag gaaagttcgg gtttagaggt 600 agaanggttc gggatttttg ttataggttggggagagatt gtcggttcgt tttcggggtc 660 gtttatattt ttttttgtag gattttatagtaaaaatagt agataaagat atttaggaag 720 tagagcggta ggcgtagtcg gtcgggtattagggagttgt tagaggttat gagacgttta 780 gaggagtcga ttggagattc gtttataatcggtatcggta gtagcggcgg cggaggcgat 840 agttttagtc ggatatcgtc gatcggcggtaggggtttta taggagttgt atgcgatcgt 900 tgtttagtag ggtttagtag ttattattagaattgtcggt ttatggttgt taagggggaa 960 attttttnag aatttagtaa ttattttttaggaaagaaaa ttcgtttntg ggattttggt 1020 tttatttttg agggttaggg gaatcggtagtttcgagatt gatttttcgt tttggagatt 1080 tttttaatta ggtaattttg aggataattgcgatttagag tattataggg tgttttagag 1140 ttatttgggc gtagaataat gacgtataaggatgtggagg ttattaattg gttgcgttgt 1200 gcgaagacgg ataggtaggc ggggcgggaggaggtgtggt cggtagagta aatttaatag 1260 tttttttcgc ggcgggcggt taggtttttgttgggtttta atgttaaatt ttttattgga 1320 gttttagcgt cgtttagttg ttgtttagcgttagcgattt tatttgttta ttatttaggt 1380 atattattag gtttttaagg gggagagcggtatagtaagt ttcggtttgg ttatttaaag 1440 gcggggtaat ttattcgtgt tatttaagttttgagttaga gttttttagg tttggaaatt 1500 agggataatt agtaatagtt attttgtcgttttttggttg ttgtgaggat taaataagag 1560 tgttttgtaa attgtaaagt atgttgtgtaagtttaaggt attattagtt attattgttt 1620 gttagttttg attttatttt tttatatcgaggggtggaaa tggaagttta ttgaagttag 1680 ttttttttta agttttaata atttattaataatggcgtaa atttttcggt cgcgtttttg 1740 aatatttttt attaatgagt ttttcgttggattttttttt tatgtaagtg ttgggttttt 1800 atttgttggt acgaattgtt agggtaagattgattttagg tttttttatt attattttta 1860 attttttant ttaattnngg tttaaattttcgngttattt ggtggatttt gggttgtttt 1920 ttaggtcgag gttttttttt tagtagtttgtttttttggt atagttttag gtaaaggaag 1980 gaaatattgg gtagtattat antttatcgtttcgggtttg atttaataag gttttgcggg 2040 ggagttagaa gttttttaga gggaggagtaagggatagaa gatagggtgt ttttagttta 2100 ttgttttttc gatattagtg gtatgggaaagttttnatat atttgttttt ttgtttatta 2160 gtttatttta ttggtttagt tcgcgatgttagggtattaa atagttggga agagagattt 2220 gttagtttta tttttttatt agttgggattttaaataatt cgtttgtttt gagtcgagtt 2280 tttttacgtg aaattaatgg gaatataataataagtagga gagcgttgtg gttagaaata 2340 tgggtattgg atttaaatga ttaggtttttaattttagtt tttttatttt atatttgtgt 2400 tttttgggga aagttattcg atttatttgtttttttttga ttatatagtg ggatttatta 2460 tatttttttt attgggtggt tgttatattttaataatatt ttatgtaaag tatttaatat 2520 ggtagttggt ttttattagt ttaatgaatggtggttggga tagtttggtt taggagtttg 2580 ttgttaggtt ttatgaggta gatataattgtatttattat gattgttttt ggggtagtta 2640 attgtttatt tatataatgg ggnatgtgttnttttgtgaa aatgtttcgg aaattttaaa 2700 gtattattga aatattgaga tggttatttttatttttttt aaaagtttaa gagtttttat 2760 aggtgtagta ttataaaggt tgcgaaaggataagagtagt gtttttgtat agtttttttg 2820 ttttttttaa ggttgtatat tatgttgtgggtattttttg agatgaatta aagttttttt 2880 aaaattgtta agagatttaa ttagtgtaaagaatatttan taatgttaaa ttgttttttt 2940 ttggttattt gttttttttt tttgaaatttatttttttta gggagttttt ttagatttat 3000 ataagaatgg gtaatttttt tagtgnatttttttatttta tttttaggat aaattatttn 3060 tttttatttt ggatagtttt tttatgggtttgttgtttat atgtttatgt aaagtatgta 3120 agtatggtgt ttagaggata ggaattttgtgtatagttat aataatattt agatgtggga 3180 attgaggttt ttttttttga agataaagatgaaatgatta gtatatattt ttaattttta 3240 ttttattttt ttttttttaa atatttaatagaattttaag ttgttgggaa tatttattta 3300 tttatttggt ttattaatat taagatttgtaaaaaataat ttttaaatat aagataagaa 3360 aattcgaata ttaatatttt ttaattttgtgtaagttttg tagtatngga aaatatataa 3420 attttaaata gttgtaaaaa tagtgtttttgggagaaaat agagttttta tatcgatata 3480 agaaaaatag gtattttttt aatttatttagttttggggc gggcggagag tatagagtcg 3540 ttatttgtta tttggaggaa tgttagtttttttnttttat tatttatttg gggttgggcg 3600 ggttgggttg ttatttaaga taatttttagttagggtgaa agcgagatga aaatgttatt 3660 tgggaaaata tttgtttttt ttttttgttagtagttgaat tggttaagtg ttatggttcg 3720 ttagggttgt tttggttagt ttttttaatgagagggaggt atgggaatag ggttgagagg 3780 atggngggat ttattttatg gttttttggaggagagggaa ggaaatttgt ggcgtttttt 3840 ttttttcgtt tatggttagt ttgttttgtgataaaaataa ggngtttttt atatagttat 3900 ttggattgat atttaggggt gggggatttaagattttttg ggtgtttttt attaagtgag 3960 ggatgtggta ggtatatagg tgtgaattgtgagttgttta gttattagtg gagaaggtag 4020 gttttattac gtttagaggg gtcggtgtttattaaaaaga ggatttaggg ttttgatata 4080 gtaagtgaaa gaaagtgttc gaaggtcgagagggaagggt tttnntttna tanttttatt 4140 ttaggggatt tggggaggga tttgttanttnaaggtattg gtttttatgg taaagtgggg 4200 taggggtggg atttttagna ttatntagggagttttggaa aagtataggt ttttttgatg 4260 gtggggtgcg ttgttatggt tcgaatggtagtggggaggt tttggaggtt ttcggatttt 4320 ttcgaggtgg tggtttgggg ttggtcgggggaaggggaga tttcgggttt gaggggtagt 4380 tacggaagat gaagtttatg tcggggaagaggggttttat taggttgacg gggtagaagg 4440 ttgagttagt cgggttgaaa tggattttgtttttgttagg ataggaagtt aggaaggtta 4500 ggttaggatt tggagatttg gaggatgaagagagatatat aagatatata cgtatatata 4560 gnagagaaat agatagcgag agagggtgagatgttatagt attaaggtag taggagagtt 4620 gggtttttgt ttaaatagaa ttggaatttgatcgaaaatt aagtttttta tttttttatt 4680 tttaaaaaaa tatggttaaa taacgggaaatgttttttag ttaaaaaaag gagggattga 4740 agttagatag gaaggagaat ttttntgataatgtgattta agaagtggag attaagaaat 4800 nttttttatt cgaaagattt tattagtggtcgggtacggt ggtttacgtt tataatttta 4860 gtattttgga aggttaaggt ggatggattatttgaggtta ggagttcgag attagtttgg 4920 tcgatatggt gaaattttgt ttttagtaaaaatataaaaa attagtcggg tgtggtagta 4980 tgtttttgta attttagtta tttagaaggttgaggtagga gaattatttg aatttgggag 5040 gcggaggttg tagtaagtta agatcgtgttattgtatttt agtttgggta atagagtaag 5100 attttatttt aaaaagaaaa gaaaagaaatatttttttag tgaatggtgt ttttggggat 5160 agattatatg tttgaaagta gagattaaagttaagtgatn taaagtgggg ttnttttagt 5220 tttggtatta ttgatatttt gggttggatgattttttgtt gcggggtggg gatggaggta 5280 ttgttttgtg tattgtaaga tgtttaatagtgtttttggt ttttatttat tagattttag 5340 tagtattacg attttttttt tttagttgtgataattaaaa atgttttttg atattgttaa 5400 atgtttttta gttgaaattt attggtttaaagaatttaat tgttgggtat atttgaaagg 5460 tatggggttg tttattgttg ttgttttgtttttgagatag agttttattt tgtggtttag 5520 gttggagtgc ggtgtggtag gattatggnttantgtagtt ttgatttttt ntcggtttaa 5580 gtaatttttt tattttattt ttttgagtagttgggattat aggtatgaat tattatgttt 5640 agttaattgt tttattttta ttttgtagagaaggggtttt tgtatgttat ttaggttggt 5700 ttttagaaag gtgtgatttt taaaattttgagaggaaagg atggtaataa ttgtgnagaa 5760 aggtagttag attttatcgg aagatttgggttttaattta ttatgtggtt tttgttatat 5820 ttgttttatt ttttttttta attttaattttttaatt 5857 43 8238 DNA Artificial Sequence chemically treated genomicDNA (Homo sapiens) 43 aatagtaaat atttttaaaa gatatttttt ttttaaagtagttgttttaa tatgtattat 60 ttttatagcg tgtttttatt atagttattt gtgtgtatattttatgtttt ttagtgagtt 120 tttgaggatt ttttaaattt taaatattta taaatagtgatgaatgtacg aatttggatg 180 tgtgtggagg atgtgttgta gttgatttcg gtttttttttagtagtaaaa ttagttgttt 240 gttaatgatg tatttggttt gaattttagt tagaatattgattacgttaa agagattttt 300 gttggtagaa tttttttttt ttttttttaa aggtttgtatttgtgaatgg ttattttagg 360 aaaagtaaat atttgttaaa atagtaagaa taaatttattttttaagttg aatattttaa 420 gtggtttttg gataatttta cgtcgattat ttttttagagtaagaaaata gtttttaaga 480 gtataggtta aattaatttt aaaatgtagt tttttgtggaaattttattg taggtatgtt 540 ttaatgtaga tggatgggtt agatggaggg agtaatggtagtttgaagga ttttgttaat 600 tacgtggata aaatttttag tgttagaatt ttagtttgttaagagtaatt tgtttttatt 660 tttaggattt gagtatgggc gttaggtaga tgtatgatagttgtttggaa tatattattt 720 tgatttttga aggttattag atttaatgaa gtaaatttttgatgaagaga tgagttattt 780 tagatgaggt tagagagtga atattttttt ttagagttagatttaatttg gttagggata 840 ggtgatttta tggttttgat tatttgttat tttgatttttttaggagttt taagtaagat 900 tgattttttt atttgataaa ggtttatagg atgtttaatttgggttaggt tttaggaatg 960 taaagtgaat tttattgttt tttaaaggag tttagagtatagatttatag gtataaaaat 1020 aagtggtttg tagtgttagg attcgttata agtttgtatagtttttggga gtttttagga 1080 gggatttaaa tagtaaattt tataggggag ggtgaaaaaaagttaatatg gatgttaatt 1140 atgtatagaa aaaataatta aatgttaatg gttattatgtaagtgtaaaa ttgttggtaa 1200 tttttttgtt tgtgtttttt aattttttat taattgaaaaatggtgtgtg tgtgtttttt 1260 taaatagttt taaaaataaa ttatggtatt gttgattttgatattttaga aattggttag 1320 ttttaagggt aaaagggaat tgagtggtta ttttgtgttggatttggtat agtaatatta 1380 atttatttta tttttagtga tattttaatt tttttttataaatggggaga ttgaagttta 1440 gaaagattga tagaattatt tagagttatt ttttagaattatagatagaa tttaaaattt 1500 cggtttttaa attcgggatt tttcgtttga ttttttcggttttgaaattt ttttggaaga 1560 ggttgttatt gatgttggtt atttttaagt ttattttaattttgttttaa gattttttat 1620 atagtgttaa gtatagtaat ttgaatatag aaggttttttaatagaaatg cgtttatagg 1680 attttgatat attatggttt atttagtttt tgattttttttagttgaatt aaatatttag 1740 attttatttt aaaaatttta agaatagttg atttaggggtgtgtgtttgt agttttattt 1800 ttttttgagg ttgaggtaga aggatttttt gagtttaggtgttcgaggtt aatttgggta 1860 atatagttga gattttattt gtaagtgaaa agaaataaaaattttaagaa tgagtattag 1920 taatgttttg aatgatatta ttttgttttt agttattttttaataaaatt gtttaaattt 1980 aataggtaaa tgaatttttt attttatttt tgttggaaattagttgtgta gataattttt 2040 atataaaata agaatgttga atttagataa tttttgatattttttttttt tttttttttt 2100 tttttttttt ttttttagcg atatagtttc gttttgtagtttaggttgga gtgttggtgg 2160 tatagatcgt ggtttattgt agtttagaat ttagggtttaagagattttt ttattttagt 2220 tttagttttt taagtattag atattatagg tacgtatcgttatatttggt taatatttat 2280 attttttata gagatggggt ttttttatgt tgtttaggttgatttttaat ttttgggttt 2340 aagtgatttg ttttggtttt ttaaagcgtt gggattataggcgtgagtta ttttgtttgg 2400 ttttagaaag ttgttacggt ttagagtatt attaagtattgtttgagtgt tttattgtta 2460 atttgatagg taaaaattaa tgttttaatt ttttagttgattaaataatt tatttatatt 2520 gagtaaagta taaagagttt aagaaagaaa ttatatatgagtgttttaga tttagtagta 2580 gtattttggg gaagttatat atagtatagt tagatatttttgttagtagt tatttttagt 2640 tggatgattt ttatattatt tttgttttga ttgttggtatttattttttt gagataaagt 2700 ttgatgaaag ttatggattt tttttttgga aaaatatacgtttgtatgta attttgtatt 2760 ttattttagg agattttgga ttttttgtag attgtttttggattttgggt taaaaatttg 2820 tattttagat tgaatcgtgg gaagaaaaaa tagttagtgagtttttggta aatcggagta 2880 ttggattttg tttagtaatt gtaaattttt gaatatattggatttattgg gtagtgttaa 2940 gtttaaaggg aagtaagtta aattttaagt attatgttttgttaatttgg tagttcgaat 3000 taagagtggt tgtgagatta tatatggttt gatttgttattggtagattt ttgttgaaat 3060 atgaattaat tagtttttta gaaagtaagt atagatggaataagtatgtt tagtttttgg 3120 taattttttt ttaattatga atttattttt aagttttttttttttttttt tttttagagg 3180 tgatttttat gtatatgttt taattttttt ttaattattagtttttttta tagtttagtt 3240 tttattttat ggtttattag gatgtttaat ggtaaattgggtataaagag gtgtgtgaag 3300 ttttgtggag gggttagttt tagggttggg ggtgattggggagagtagtt atggttttga 3360 tttatgtgat ggggcggtag ggtaaatatt agtttgtttagtgatgttta gattttaata 3420 tttatataag taacggattg tagtttgtag tttgattttttttagttttt tagttatttt 3480 ttgttaataa tagttttttc gtttgtttgt ttgttttttgagacggagtt ttatttttgt 3540 tgtttaggtt ggagtgtaat gcgtagtttt ggtttattgtagtttcgttt ttttaagttt 3600 aagcgatttt tttgttttag ttttttgagt cgttgggattataggtatgt attattacgt 3660 ttggttaatt ttgtattttt agtagagacg gggtttttttatgttggtta ggttggtttc 3720 gaattttcga tttaggtgat cgtttgtttt tgttatttaaagtgttggga ttataggtat 3780 gagttatcgt atttggttaa taatattttt tatgttataattttttagga taagttttgt 3840 agaaataatt attttagtag aatagattgt tttgtttgggaattttatat atgtgtgtgt 3900 gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtatgtatttatgtat gtatgtatat 3960 gttggtttaa tttaatttgt tgtgaatatt ttaaagttattataagttaa tatttttttt 4020 ttagtttttt tgttttttat ttttgtttat gataaatttgatttatagaa gttttagata 4080 tttgtggtta aataaaagat tttaggttgg gtatagtggtttatattttt aattcgaaaa 4140 ttttgggagg tcgtggtggg tagattgttt gagtttagagggatggatag tttttttgtt 4200 ttttgtttta tgtttagttt ttggtagttt tttttgatttggtttttttg tttttggttt 4260 ttgttttata gttgtagttg ttttatagta ttgtgtttgatggtattgga ttgtggtagg 4320 tgtttaataa atatttagtg tttagtaggt atttagttaatatatagtgt attagttttg 4380 gaaagagttt tatttttatt gattggttgg ttgattgattgtttgattga tagggtatta 4440 ttttgttgtt taggttggtt ttaaattttt gggtttaagtgattttttcg ttttagtttt 4500 ttgagtagtt gggggttata ggtataaatt attatatttgatttaagatt tttatttttt 4560 tttttttttt tatagagatt atgttgttta ggttggtttttaatttttcg gtttaagcga 4620 tttttttatt ttggtttttt aaggtgttgg aattatagatgtgagttatt acgtttggtt 4680 attttttttt ttttgagatt gggttttttt ttgttttttaggttggagta tagtggtata 4740 attttagttt attgtagttt taattttcgg gtttaagtaatttttttatt ttagtttttt 4800 gagtagttgg gattgtagat gtatattatt atatttagttaattttttaa ttttttttag 4860 tgatggagtt ttgttttgtt gtttaggttg gttttaaatttttgggttta cgtgattttt 4920 tggttttagt tttttaaagt gttgagatta taggtataagttaaggattt ttatttttaa 4980 tgtatttttt tttttttgga tagatttgtg gtttttttatttgaaggata taatgttttt 5040 taaattagta tatttgtaga ggtttgttgt atttagtcgcggagtttatt ttttagtggt 5100 ttttgttata tttgttgtaa ttaaaaaaat agtttaaggttttttaattt ttgatgatat 5160 ttttgaaagg gaatataagt atggtgtata taattattattttttatttg tagttttgga 5220 gagaggaaaa ggtacgtttt aaattaattc gttttttttttttttttgaa attttttata 5280 aaaaaaaatt gtttttatat ttttataata tatatttttttagatgtgtt taatgtgtat 5340 attgtagata tggttaattt tttttttttt ttttttttttttttttgaga cggagtttta 5400 ttttgttatt taggttggag tatagtggta taattttagtttattgtaat ttttgttttt 5460 taggtttaag cgattttttt gttttagttt tttgagtagttgggattata ggcgtgcgtt 5520 attatattta gttaattttt gtatttttag tagagatggggttttattat gttggttagg 5580 ttggttttag atttttgatt ttgtgatttt tttattttggttttttaaag tgttgggatt 5640 ataggtgtga gttattacgt ttggttagtt aatttatttattgagtgttt agtgttgttg 5700 tgttaggtgt tatggaggtt ttaaagagga attattgtttttgttatgta gattttatta 5760 agagggaatg taagagaaat aaggaaagta ttattatattgttgttattt ttttttttta 5820 atttttattt tggtatagtt ttagatttaa gaaaagttgtaataaatagt attgatattt 5880 tttttttata ttttttttag attttttaag tgttaattttttgttgtttt ggttttagtg 5940 tgtttatttt tttttttttt tttttcgtcg tttgtatattttatattgtt ttttgaattg 6000 ttttgagagg aagttgtaga tatgatattt tttttttttttttttttttt tttttttttt 6060 ttgagacgga atgttgtttt gttatttagg ttggagtgtaatggtgggat ttcggtttat 6120 tgtaattttt atttttcggt tttaagtgat ttttttgttttagtttttcg aggagttggg 6180 attataggtt tacgttatta cgtttagtta atttttgtatttttagtaga gatagggttt 6240 tattatgttg gtcgggttgg tttcgaattt ttgattttaggtgatttatt tattttagtt 6300 ttttaaagtg ttggattata ggcgtgagtt atcgcgtttcgttatatgat atttttttat 6360 ttataaatat ttagtgtgtt tttttaaaaa cgtaatgattttttgagata gggttttatt 6420 ttgttgttta ggttggagtt tagtggtgtg attatggtttattgtagttt ggaattttcg 6480 gttttaggtg atttttttat tttagttttt taagtagttgggattatagg tgtgttttat 6540 tatgtttggt ttattttttg tagagattag attttgttatgttgtttagg gtgattttga 6600 atttttggtt ttaagtgatt ttattattta gttttttatagtgttgggat tgtaggtgtg 6660 agttattgtg tttagttgat tttttttttt ataattatagagtaattgta aaaattaaga 6720 atttaatatt ggtatagtat tattagttta gagatttaatttagatgtta tttgtttttt 6780 tttataataa aagaaaaatt ttcgatgagt tgtatttagttgttatgttt agtttttttt 6840 aatttagaat agttttttaa tttttggttg ttttggtttttttttttttt gtattaagta 6900 ttttgtgggg atagagtgta aaattttgta aatatttagttatttatgaa tttttattta 6960 taattttagt atttattaat gatttttgtt tgaataaatgattacggtgg tagttgttaa 7020 atggtgattt aatttataat ttggaataaa taatagttttaattaaataa aattaaagtt 7080 tattatttag ttttgtatta gaaaatgata atataagagtattatatatt ttggttattt 7140 gtttgtattt tatttggtat tagtattgta gatatatttttttttgaatt attgaaaatt 7200 tgttttatat tatatgatat ggtaattttg tttttatttttttattagta atgtatgaga 7260 gtgttaattt ttttagattt ttgttaaaag ttgtttttttaattataatt attttaggga 7320 gtatgagatg gtattttatt gtggttttaa tttgtatttttttaatgatt agtgatgttg 7380 aatatttttt tatgtgtttt ttgttatttg tatattttttttgaagaaat agttatttaa 7440 gttttttttt attttttaaa ttgggttgtt tgtttttttgaaattgagtt gtaagaattt 7500 tggatattag atttttatta gatatatgat ttataaatatttttttttta ttttaagggt 7560 tattatagtt tattttttat gatttttgtt tgttatgtgtaatttttgtt tttttatttt 7620 taaattttat ttattttatt ttattttttt tataggtaggattttgtttt ggtgtttagg 7680 ttggagtgta gtggtataat tttaatttat tgtattttttattttttagg tttaagtaat 7740 ttttttattt tagtttttgt aacgggatta tacgcgcgtattattatgtt tagtattttt 7800 ttgtagcgtt agggattttg tcgtgttgtt taggttgatttggaattttt gggtttaagt 7860 aatttttgtt ttggtttttt aaagtgttag gattataggcgtgagttacg gttttttgtt 7920 taatttttgt ttttaaattt taattttgga ttttaaattttagaattagg taaaggtttt 7980 attttagagt ttataatttt tttgtgttat ttttgttaaatgtgtgtttt gaagttgggt 8040 agataaaata taatttttag taatttttta taaattaaagtttattatgt ttgagttaaa 8100 ataagtttta attataaata tgtattaaat agaggtttatatataggtat ttagagggtt 8160 tgttagtatt tttaattttt ggattttatg tcgtatagtaattgtttaaa attatttttt 8220 ttttttatgt attttagg 8238 44 8238 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 44tttaaaatat ataagaaagg aaaataattt tagataatta ttatacggta taaagtttaa 60aaattaagag tgttagtaag ttttttgaat gtttatatat gaatttttat ttaatatata 120tttgtagtta aagtttgttt tagtttaggt ataataaatt ttggtttgta aggaattatt 180aagaattgta ttttatttgt ttagttttaa aatatatatt taataaaaat aatataaaaa 240ggttataaat tttggagtaa aatttttatt taattttaag atttaggatt taaaattaga 300atttaaaagt agaagttagg tagggagtcg tggtttacgt ttgtaatttt agtattttgg 360gagattaagg tagggattgt ttgagtttag gagttttaga ttagtttgga taatacggta 420aaatttttga cgttatagaa aaatgttggg tatggtagtg cgcgcgtatg gtttcgttat 480agaggttgag gtgggaggat tgtttgagtt tgggaggtag aggatgtagt gagttgagat 540tgtgttattg tattttagtt tgggtattag agtaaaattt tgtttataaa aaaaataaaa 600taaaataaat aaaatttaaa aataaaaaag tagaagttat atataataga taaaaattat 660gagaagtaga ttgtaataat ttttaggatg gaaaaaaaat atttgtaaat tatgtgtttg 720ataaggattt aatatttaga atttttataa tttaatttta aaaggataaa taatttaatt 780taaaaaatgg ggaaagattt gaatagttat ttttttaaag aggatatata aatggtaaga 840aatatatgaa aagatgttta atattattaa ttattaggaa aatgtaagtt aaaattataa 900tgagatatta ttttatattt tttgggatgg ttataattaa aaaaataatt tttgataagg 960atttgaagaa attggtattt ttatatattg ttagtgggaa agtaaaaata aggttgttat 1020gttatgtaat atgaaataga tttttaatag tttaaaagaa gatatgttta tagtattggt 1080attaaataaa atataagtaa atgattaaaa tgtgtgatat ttttatattg ttattttttg 1140gtataaagtt aagtaataaa ttttggtttt atttggttaa ggttgttatt tattttaaat 1200tatagattaa attattattt ggtaattatt atcgtaatta tttatttagg taagaattat 1260tagtggatgt tgaaattgtg agtaaaagtt tatgagtaat tggatattta tagagtttta 1320tattttgttt ttataagata tttaatataa agggaaagaa gattaagata attaaggatt 1380gaggaattgt tttgggttaa agaagattaa atatgataat tgaatgtaat ttatcggagg 1440tttttttttt gttataaaag agaataaatg atatttggat taggttttta gattaatggt 1500gttgtattag tgttaagttt ttgattttta taattatttt atggttataa aagagaaagt 1560tagttgggta tagtagttta tatttgtaat tttagtattg tgggaggttg agtggtagga 1620ttatttgaga ttaggagttt aagattattt tgggtaatat agtaaaattt aatttttata 1680aaaaataagt taggtatggt aaggtatatt tgtagtttta gttatttggg aagttgaggt 1740gggaaaatta tttgaagtcg ggagttttag gttgtagtga gttatgatta tattattgaa 1800ttttagtttg ggtaatagaa tgagatttta ttttaaaaag ttattgcgtt tttggaaaga 1860tatattaagt atttatgggt aaagagatgt tatgtggcgg ggcgcggtgg tttacgtttg 1920taatttagta ttttgggagg ttgaggtggg tggattattt gaggttagga gttcgagatt 1980agttcggtta atatgatgaa attttgtttt tattaaaaat ataaaaatta gttggacgtg 2040gtggcgtggg tttgtagttt tagtttttcg ggaggttgag gtaagagaat tatttgaaat 2100cgagaggtag aggttgtagt gagtcgagat tttattattg tattttagtt tgggtgataa 2160agtaatattt cgttttaaaa aaaaaaaaaa aaaaaaaaaa aaaagaagag atgttatgtt 2220tgtaattttt ttttaaaata gtttagaaaa taatgtagaa tatgtaggcg gcggggggag 2280aagagaaggg agtgaatata ttaagattaa agtagtaaaa agttagtatt tggaaaattt 2340gggagaagta taaaaggaaa atgttagtat tatttgttat aatttttttt aagtttaaaa 2400ttatgttaaa ataaaagtta aaagaaaaaa atgatagtaa tatgatagta ttttttttat 2460tttttttgta tttttttttg gtaaggttta tatgataaag ataatggttt ttttttgaag 2520tttttatagt atttaatata gtagtattag atatttaata aatgaattaa ttggttaggc 2580gtggtggttt atatttgtaa ttttagtatt ttgggaggtt aaggtgggag gattataaag 2640ttaggagttt gagattagtt tggttaatat ggtgaaattt tatttttatt aaaaatataa 2700aaattagttg ggtgtggtgg cgtacgtttg tagttttagt tatttaggag gttgaggtag 2760aagaatcgtt tgaatttggg aggtagaggt tgtagtgagt tgggattgtg ttattgtatt 2820ttagtttggg tgatagagtg agatttcgtt ttaaaaaaaa aaaaaaaaag aagaagaaga 2880attaattatg tttgtaatat atatattaaa tatatttaga aaaatgtata ttgtgaaaat 2940atggaagtaa ttttttttta taaaaggttt taagaaaagg gaaaagacgg attaatttga 3000aacgtatttt tttttttttt tagggttata ggtaaaggat ggtagttgtg tgtattatat 3060ttatattttt ttttaaaaat gttattagag gttggagggt tttggattgt ttttttagtt 3120gtaatagatg tagtagaagt tattgaagaa tgaatttcgc gattaagtat agtaaatttt 3180tgtaaatgtg ttagtttgga aaatattgtg ttttttaagt agaaaaatta tagatttgtt 3240taaagaaaag agaatgtatt aagagtgaga atttttggtt tatgtttata attttagtat 3300tttgggaggt tgaggttaaa ggattacgtg agtttaggag tttgagatta gtttgggtaa 3360tagagtaaga ttttattatt aaaaaaaatt gaaaaattag ttgggtgtag tggtatgtat 3420ttgtagtttt agttatttag gagattgagg tgggaggatt gtttgagttc ggaagttgag 3480gttgtagtga gttgagattg tgttattgta ttttaatttg ggagataaag aaaggtttag 3540ttttaagaaa aaaaaaatgg ttaggcgtga tagtttatat ttgtaatttt agtattttgg 3600gaggttaaga tgggaggatc gtttgagtcg aggagttaaa gattagttta ggtaatatag 3660tttttataaa agaaaaaaaa agagtgagaa ttttgagtta ggtgtggtgg tttgtgtttg 3720tagtttttag ttgtttagga ggttgaggcg ggaggattat ttgagtttaa gagtttgagg 3780ttagtttggg taatagagtg atattttgtt aattaggtaa ttaattaatt aattaattaa 3840taagagtaag atttttttta gagttaatgt attgtgtgtt gattgagtat ttgttaaata 3900ttaagtattt gttaagtatt tattatagtt taatattatt aggtataatg ttatgagata 3960gttataattg tagggtagag attagaggta gggagattaa attagagaag attgttagag 4020attaggtatg gggtaggaga tagaggaatt gtttattttt ttgggtttaa gtagtttgtt 4080tattacggtt ttttaaagtt ttcgaattaa aggtgtgagt tattgtgttt agtttaaaat 4140tttttattta gttataaata tttaaaattt ttgtaggtta aatttattat aaataaaggt 4200gaaaggtaaa aagattagga aaaaaatgtt aatttataat agttttaaag tgtttatagt 4260aagttgaatt agattaatat atatatatat atataaatat atatatatat atatatatat 4320atatatatat atatatatat atatatatat atgagatttt taaataaaat aatttatttt 4380gttaggatgg ttgtttttat aaaatttatt ttgaaaaatt gtagtataaa agatattgtt 4440gattaggtgc ggtgatttat gtttataatt ttagtatttt gggtggtaga ggtaggcgat 4500tatttgaatc gggagttcga gattagtttg attaatatgg agaaatttcg tttttattga 4560aaatataaaa ttagttaggc gtggtggtgt atgtttgtaa ttttagcgat ttaggaggtt 4620aaggtaggag aatcgtttga atttgggagg acgaggttgt agtgagttaa gattgcgtat 4680tgtattttag tttgagtaat aagagtgaaa tttcgtttta aaaaataaat aaataaacga 4740aaaagttatt gttagtaaaa ggtaattgag aaattagaga gagttaaatt ataaattata 4800attcgttatt tgtatgagtg ttaaagttta aatattattg agtaggttgg tgtttatttt 4860gtcgttttat tatataagtt agagttatag ttattttttt tagttatttt tagttttaaa 4920attagttttt ttataaggtt ttatatattt ttttgtattt aatttattat taagtatttt 4980gataagttat gaagtaaaaa ttaagttatg aaagaaatta ataattaaaa ggaaattaga 5040gtatgtgtat aggaattatt tttggaagga aaaaaaaaaa aaaagtttaa agataaattt 5100atgattagga gaaagttgtt aaaaattagg tatatttatt ttatttatat ttatttttta 5160aaagattagt taatttatgt tttaatagaa gtttattaat gataagttaa attatgtata 5220attttatagt tatttttgat tcgagttgtt aaattagtaa aatataatat ttggagtttg 5280gtttattttt ttttaaattt ggtattattt agtaaattta gtatgtttag gaatttgtaa 5340ttgttaaata aaatttagta tttcggtttg ttaaagattt attgattatt tttttttttt 5400acggtttagt ttagaatata gatttttaat ttaagattta gggatagttt gtagagagtt 5460taaaattttt tgaaataaaa tgtagaatta tatgtagacg tatatttttt taagaagaag 5520gtttataatt tttattagat tttattttaa aggggtgggt attaataatt aaaataaaag 5580tgatgtaaga attatttaat tggaggtagt tgttagtaaa aatgtttaat tgtattatat 5640gtaatttttt taaaatatta ttgttaagtt taaaatattt atgtatgatt ttttttttgg 5700attttttatg ttttatttag tatgaataaa ttgtttgatt aattaaaaaa ttagaatatt 5760aatttttgtt tattaaatta gtagtaaaat atttaggtaa tatttagtgg tgttttaaat 5820cgtaataatt ttttagggtt aggtaaggtg gtttacgttt ataattttag cgttttggga 5880ggttaaggta gattatttga gtttaggagt taaagattaa tttgggtaat atagggagat 5940tttattttta taaaaaatat gaatattagt taggtgtggc gatgcgtatt tgtagtattt 6000ggtatttagg agattaagat taaggtggaa agattttttg agttttgagt tttgggttgt 6060agtgagttac gatttgtgtt attagtattt tagtttgggt tataaagcga gattgtgtcg 6120ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaggaat attagagatt atttaaattt 6180aatattttta ttttatataa aagttatttg tatagttaat ttttaataga aatgggatga 6240aaaatttatt tatttgttaa gtttaggtag ttttattaaa gaataattgg ggataaaata 6300atattattta aaatattatt aatatttatt tttaaggttt ttgttttttt ttatttatag 6360atggagtttt agttatgttg tttaggttgg tttcgaatat ttgggtttaa gggatttttt 6420tgttttagtt ttaggaagag gtgggattat aggtatatat ttttgagtta gttattttta 6480aggtttttaa gatgaagttt ggatatttaa tttaattggg aaaggttaga aattggatga 6540gttatgatgt attaaaattt tgtaaacgta tttttattaa agaatttttt gtgtttaagt 6600tattgtgttt ggtattgtat gagaaatttt agagtagaat taagatggat ttaaaaatag 6660ttaatattaa taatagtttt ttttaaaaag gttttaaaat cgggagaatt aagcggaaaa 6720tttcgagttt ggagatcggg attttaaatt ttgtttgtgg ttttgaagag taattttggg 6780tgattttgtt aatttttttg agttttagtt tttttatttg taaaaggagg ttgaagtgtt 6840attgaggatg aaatgggtta atgttattgt gttaaattta gtataaaatg gttatttagt 6900ttttttttgt ttttaaaatt agttagtttt tgaaatatta gaattaatag tgttatgatt 6960tatttttaaa attgtttaaa aagatatata tatattattt tttagttgat aaaaaattag 7020aaaatataga taagaaaatt attagtaatt ttatatttgt atgataatta ttaatatttg 7080gttatttttt ttatgtataa ttagtattta tattagtttt tttttatttt tttttataga 7140atttattatt taagtttttt ttagagattt ttagggattg tgtagatttg taacgggttt 7200taatattgta ggttatttgt ttttatgttt ataagtttat attttaagtt tttttaaaaa 7260atagtaaaat ttattttgta tttttagaat ttagtttagg ttgggtattt tgtgggtttt 7320tattagataa agaggttagt tttatttagg atttttgagg gagttaaggt agtaagtgat 7380taagattatg ggattattta tttttgatta ggttgagttt aattttaaga gggggtgttt 7440attttttgat tttatttaga ataatttatt tttttattaa gagtttattt tattagattt 7500aatggttttt aaaggttaaa ataatgtgtt ttaggtagtt attatgtatt tatttgacgt 7560ttatatttag gttttggaaa tgagaataaa ttgtttttgg taagttagaa ttttaatatt 7620gaaggtttta tttacgtaat taatagggtt ttttaggtta ttattatttt ttttatttag 7680tttatttatt tatattagaa tatatttata gtagaatttt tataaaaggt tgtattttga 7740agttaattta gtttatattt ttaaaaatta tttttttatt ttaaaagaat agtcggcgta 7800aagttgttta aaagttattt aaaatattta atttgaggag taaatttgtt tttgttattt 7860tgataaatat ttattttttt tgaggtaatt atttataaat ataggttttt aaaaaaaaaa 7920aaaaaaagtt ttattaatag aagttttttt gacgtaatta gtattttggt taaaatttaa 7980gttaagtgta ttattggtaa ataattagtt ttattattga gaaaggatcg gggttaatta 8040tagtatattt tttatatata tttaaattcg tgtatttatt attatttgta aatgtttgag 8100atttgaaagg tttttaagaa tttattaaag ggtataaaat atgtatataa ataattgtaa 8160taaaggtacg ttatggggat aatatatatt aagatagttg ttttgaggga aaaatgtttt 8220ttaaaaatgt ttattatt 8238 45 7025 DNA Artificial Sequence chemicallytreated genomic DNA (Homo sapiens) 45 aagaaatttt ggatttaagt ttgacgtttgattaattgga tttaatattt tgtagaatat 60 tttattttat aattatgaaa tttatattttatttattttt atatgaaata tagtttaaga 120 ttaataataa tttttgttat gaagtaagattgaatatatt tataataatt gaaattattt 180 taaatgtaaa ttataggngg aggtataaaatgttttgtaa ggaaaaggat attatgttat 240 ttttaaataa tggaaaaatg ttattttttaatagaaagga gtggattttt tttgtagatt 300 cggagtttag gggagtttag aaattgaagattttaattgt aatgaattat tttttaaatg 360 ttttataatt ttattttatt taaattgagattttgaatat ggttagtgat tagattaggt 420 tgggaattta gttagaattg agttgggtttatttttaaaa tttagttttg gatttaagat 480 ttagatttat ttggtggtgg ggatcgggtgtttttatatg aagtgagagt ttttgtatat 540 gttgtagtta gggaagtagg agttgaggagagatagagta atgtgatttt aagtttagtt 600 ttttataaat atatatattt gtaatgaagagtttagatgt tttaatattt aaaacgatat 660 atgattttaa gataataata gttatgttttgatgtattta tataagaaag tgttaaggat 720 agtttttttg gtataaatag aataattagttttgttttgt tgtttgatta tttataatta 780 gatatagttt aattaatttt tatagagatgagatttttat ataagaaaaa tttaaaataa 840 aggtgttgta tttaattttt tgttttttgaggatgtttta ttttgtaatg ttatagtttt 900 taatgaattg tttttttatt gtattttgtgattgattttg aattttttat tgtgtggaat 960 ttaataattt ttttttggtg tttgaatttagatttttttt tttggtaata tttttaagga 1020 gatttttttg gtttttatcg tttgttttaatttgatggtt attggttttt atttttttat 1080 tatttttttt taagtattaa ttttgtagaaaaaaatattt gtttttattg tggttataat 1140 ttttattttt tttatattga taaatttgtgatatatttta ataagtaaag tttttttttt 1200 taaaatatta ttagtataat ttattattattgaaagtatg aaaaatttaa attattatat 1260 tttaggggtt atttgtgttt tttgtattaatagtgatagg atttttatta taattggtag 1320 tgtatgattt aattttaaaa ttttattttgttgtttgttt tttttttttt gatttttttt 1380 ggtatatatt attaaatgtt gggtgtttttaagaagtaga ttttaagttg aatatttttt 1440 gatggagata attagggaga ttttttgaaaataatatttg tgaaaaagta ggaagtaaga 1500 ttggatagtg gaataaaata gtatataatttagtgtaata gtttgaatgt ttgagtgttt 1560 ttaaaattaa tatgttaaaa tttttataattaaaatgatt gtattagtag atagaatttt 1620 ttaggaggtg tttatgttat gaaggtagagttttgtttaa tggaattaat ttttttgaaa 1680 aatatgttta taataattta tttatttattttttttatta agatatggtg acgggttgtt 1740 attttggagg aatgtttaat attagtattttgatggtgaa ttttttagtt ttaagaattg 1800 tgataaataa atgtttgttg tttgtaagttagttaatgta tggtattttt ttatatagta 1860 ttttgagtat gttaagatat gtagttttagtataggtttt attttattta ttggaaattt 1920 tgaagttaag ttagtttttt agagttggtttaagttgaaa tgaggagaat gggtttttag 1980 agttttatat gtgattaggt attggatattggttgttttg gaaaagttat tatatattag 2040 atagttttta gtagagatgt attgagagagagagtttata ggtgaggtat gttagttgtt 2100 tattatttta ttagttggaa agtaatttttatatttttaa aagggaaatt tgggtgatat 2160 ataatgtttg tatttaagga tattgaaaatattgaataat attgttattt tgtaggtaat 2220 atttgtttag aaattgtgtt taaatatttttttaagaaag atttatttta ttttagatta 2280 atagattatt aatagaataa aaataaatatttttattttg tgatatgtat tttttttttt 2340 ttaattttat ttgatgtaaa tttttatttagattttttaa aagtataatt tgtttgaatt 2400 ataaggtaat ttgtgaaata agttaagtagtaggtattta gaagataaat attttttaag 2460 attgagaaat gtaagtaatg ttgtaaatatttagaaaagg aaattattgt gatttagata 2520 aaatattttt aaatgaaata aagtaattgtaattgtattt aaaatatatt tgtttggata 2580 aaaataaaag gaatttttat agttagaaaaataatgttaa ggaatatgaa atgaagttaa 2640 tataataagt gtgaaattat atagagaaaatgaagatatt ttatttgaga atgtttagat 2700 aaataagaat agattatatt attgttttattgttgataga atgatgtttt tttatattag 2760 aaatttttta tatataatta aattattttttgttttggag atagttatat ttataataag 2820 taaataataa taaatttatt atttatatatataaatataa aattatttat tttttttttt 2880 atttttttgt tttttaaaaa ttttattgttaatatttaaa ttattgtgat attgattgat 2940 attgatatgt attaagttag agaaagttagaaagaaagat agtattttaa taagttgttt 3000 aagaaatggg tttttttgtt ttttatgttgatagttgtat tttagttttg agttttgtga 3060 gaatgtgttg gtgtggttag tgaaatatagtttttatatt aatttaataa tgatatttga 3120 tgaatttgtt tagaaatatt aagaggtaattgtgtttgtt atttttagtt tttattttta 3180 ttgattttaa taatttgttg ttaaatttgaggtttatttt atatttttta ttgagaatga 3240 atttgatttt atttttatga aattgattaagatatggata tataagtttt taaagagtat 3300 attttggtat atgatttaaa gatataaaaaatatatatta tgaatgtttt gatattgttt 3360 aaaagttttg tgagtatgtt gttttgaataagaaatttat aaggaataat aagattttag 3420 aatttatgtt atttttgtag atgttattttttattagtga gttgttattt gaatagttta 3480 atttgttaaa tatttgttat atatttggtttattattatt tatttataat tggtagtatg 3540 tattaagaat tttgtggagg atttttattatttttttttg atgtagttgt tgttatgtta 3600 gaatttagta ttaaaatata tttatagaaagatgaaaaat tttttgtatt ttttttattt 3660 taattttgta tttgataatt ttaataaaaagaagtgtgat tagttttata gtgaagtatt 3720 aggtaagtta gtggttaatt tatttttttttttttttaat atgtggaagg aaattttttt 3780 ttttttgtgt ttgttagagt gtgttaatgaattaaaatag aaaataattt tttttgttat 3840 ttgaaagatg aggtttggta agttggtggagatattgaaa tttttatata ttgttggtga 3900 gaatagaaaa ttatttattt attgtgaaaaagtttagtaa ttttttaaaa gtttatatat 3960 atatttatta tataatttaa taattgtttttttaggtata tatttaagaa aaataaaaat 4020 atgtttatag aaagtatgta tattaatgttaattaacgtt atttataatg gttaaaagtg 4080 gaagaaaaat aatgttcgta tattgataaatgaataaata aattgtgttt ataagtagta 4140 tttgatatta tttggtaata aaaatgtgaacgttatttat aatggttaaa agtggaagaa 4200 aattaatgtt tatttattga aaaatgaataaataattttt gtttataagt agtatttgat 4260 aaaaagtaat aaaaatgaaa tttttatatatattatttta tggatggttt tttaaaaata 4320 ttaaattaaa taaaagtagt tagttataaaagattatata ttatatagtt ttatttattt 4380 ttaaaaagat tttgaatagg tatatttgtagaggtagaaa ttagattatt ggttgtttag 4440 tatagtgtgg gtgtagaaat ttaggtggggagatgatagt taatatatag gatttttttt 4500 ttttttagat aaaattgatt gttatgttggatgtataagt ttgtgaattt attaggaaat 4560 atttaatttt aaataattat ttatgaattatatggtatgt gaattatatt ttaataaagt 4620 tttataaaat attttttgaa ttaagatatttaaaaatttt atttgtattg tataattatt 4680 ttatttttta ttttgtgtta aggggtttgtaggatttttt tatttgttat tgtttttgat 4740 attattataa aatatattat ataaaatacgatatttgtaa ggttattaaa tttaggtgga 4800 tgatattaaa tataaatata aaagaaatattaaatatttt tgagtaaata tgaagtaatc 4860 gaattttgtt tttttgttat ttatgtatttaggatgttta tataatgtat ttattttgaa 4920 ttgaaggagt tatgttttaa tttgattgatttttttttgt atataagtat gagaaagaaa 4980 tagtgattgg aaaagaatta ttatattgtataaggatggt tttgaaatgg attatagttt 5040 tgttgatata atttagtttt tattttagttttgggagttg tggaaaggtg ttggtatggg 5100 tcgtagaata tagtttttgg atgaatatgaagataatttt gaaagaattt gtttagagag 5160 gttatgaggt gattgtattg gtatttttagtttttatttt ttttgatttt aacgatttat 5220 ttatttttaa atttgaagtt tattttatatttttaattaa aattgaattt gagaatatta 5280 ttatgtaatt ggttaagaga ttgttagaaatttaaaaaga tatattttgg ttattttttt 5340 tataagaata agaaattttg tgggtaattaatgatataat tagaaatttt tgtaaagatg 5400 tagttttaaa taagaaattt atgaaaaaattataagagtt aagatttgat atcgtttttg 5460 tagatgttta tttattttgt ggtgagttgttggttgagtt atttaatata ttttttgtgt 5520 atagttatag ttttagtttt ggttatttatttgaaaggta tagtggagga tttatttttt 5580 ttttttttta cgtatttgtt gttatgttaaaattaagtga ttaaatgatt tttatggaga 5640 gggtaaaaaa tatgttttat gtgttttattttgatttttg gttttaaata tttaatatga 5700 agaagtggga ttagttttat agtgaagttttaggtaagat tttttttagt tagtaatatg 5760 aagttttaat ttatttgtgt ttttgaagtataatttgtat aaagttataa agttagggaa 5820 gtggagtttt tgataaatga atttatgaaatgaaaatata agatgattta ttaattttat 5880 aaatattata gaaaagttta aattatggggttagtgaaaa cgttgtgatt attatttata 5940 tagaatattt taggaaatta taaatttatatattagtata tttaagattt taagtaatta 6000 tatatttgtt ttattataga atgttttagattttaaaaat agtaagattc gttaagtaat 6060 atttaatcga atgtatagat ttagaatgagtaattatata tttttttata attatttata 6120 taattgtaga aagttttttt tttaaattttagttgtttta tttagaaatt aaaagatgtt 6180 tttatgttat taggaggttg tttttatagtagagagagat aatgtttata ttttagatgt 6240 aaaaattaat aagggtaatt tgaagttttaaatgttttta tattttttta ttaaataatt 6300 ggaaattttt tatttaaagt ttaattattttgttgaagtg tgaaggttgt tatatttata 6360 tagtttattt gaaattatgt ttttttatttaaaaatacga gattgattat ggtcgagtat 6420 agatttttat tttaataatt ttttaaaaatttttagttat aatttataaa tatttttatt 6480 taatattatt aagattttag tttggatttaaatgagtagt tggtataatg attttagtta 6540 tatttataaa atagtttata gttaatttgaagaattaaag ataaaaggat tagtttaatg 6600 agttgtgtaa attagattat ttgttagaaaattgttttta tggttattgt agaattaatt 6660 gattatggag tttaaagatt tgtttaaatatttagaggtt attattgaag ttttaaagag 6720 aaaataaatt gatgtttaat tttttatgatttattttaat aattgtgagt atattgatat 6780 gatattagag atgtagttta attttataatttttttatta ttttgttttt tttataaata 6840 aataagggta aaatatagaa tatataaaaaataaattatt tttatatatg aatatatgta 6900 tatatttttt aaagtatata aattttattaatatttttgt ttgtattatt ttaatttttt 6960 ttagaaaatt atataaagta attattttatgttatttatt tttttttttt tttattttta 7020 ttagg 7025 46 7025 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 46 tttgataggaataaagaaaa gaagaagtgg atgatataag ataattattt tatgtaattt 60 tttgaaaggggttagaataa tgtaggtaaa aatgttggta aagtttgtgt gttttgaaaa 120 atatgtatatatatttatat ataggaataa tttatttttt atgtatttta tattttgttt 180 ttgtttatttataagaaagg taaagtagtg ggagaattat gaggttaagt tatattttta 240 atgttatgttagtatattta taattattaa aataagttat agagaattaa atattaattt 300 attttttttttaaagtttta atagtagttt ttagatattt aaataaattt ttgagtttta 360 taattaattaattttatagt aattatagaa ataatttttt aataaatagt ttagtttata 420 taatttattaagttaatttt tttatttttg gttttttaag ttaattgtgg attattttgt 480 gagtatggttgaaattattg tattaattat ttatttggat ttaagttaag attttaataa 540 tattaagtaaaaatatttgt aaattatagt tagaaatttt tgagaaatta ttgaaataga 600 gatttgtattcgattataat tagtttcgta tttttaaata aagagatata gttttaaata 660 aattatatagatataataat ttttatattt taataagatg attggatttt aaataaaaga 720 tttttaattatttagtgaag gagtatagaa atatttgaaa ttttaaatta tttttattga 780 tttttgtatttgagatatag atattatttt tttttattgt gaagataatt ttttggtaat 840 atgggaatattttttaattt ttaaataaga taattgagat ttagaaggaa aattttttgt 900 agttatatagatagttgtag aaaaatgtgt aattatttat tttaaattta tgtattcggt 960 tagatgttatttgacggatt ttgttgtttt taagatttga aatattttat agtaaaatag 1020 atatataattgtttaaagtt ttaggtgtat taatatatag gtttatgatt ttttggggtg 1080 ttttgtatgagtgatggtta tagcgttttt attgatttta taatttaagt ttttttataa 1140 tatttgtgagattggtagat tattttgtat ttttatttta taaatttatt tattaaaaat 1200 tttatttttttgattttatg gttttatgta agttgtgttt taaagatata aataagttag 1260 agttttatgttattaattga aaaaaatttt atttaaaatt ttattgtaaa attgatttta 1320 tttttttatattaaatattt ggaattaaaa gttaaaataa agtatataga gtatattttt 1380 tattttttttatgaaagtta tttgattatt taattttgat ataataatag gtacgtagga 1440 aggagggaaaataaattttt tattgtgttt tttaaatgag tagttaggat tgaagttgtg 1500 attgtatataaagggtatgt taaatagttt agttagtagt ttattatagg gtaaataagt 1560 atttgtaaaaacgatgttaa attttgattt ttgtagtttt tttataagtt ttttatttga 1620 aattatatttttatagaagt ttttaattat gttattaatt gtttatagga ttttttgttt 1680 ttgtgaaaaaggtaattaaa atgtattttt ttgaattttt gataattttt taattaattg 1740 tatgatgatatttttaaatt tagttttagt taaagatgta ggataaattt taagtttaag 1800 agtggatgagtcgttgggat taaaaagaat ggaagttgaa gatgttagta tagttatttt 1860 atgatttttttgaataagtt tttttaggat tgtttttata tttatttaaa ggttgtattt 1920 tgcggtttatattagtattt ttttataatt tttagagtta aagtaaaaat tgagttgtat 1980 tagtagaattgtagtttatt ttagagttat ttttgtgtaa tgtgataatt tttttttagt 2040 tattgttttttttttatatt tatatataga gaaaaattaa ttaagttaaa atataatttt 2100 tttaatttaaagtaaatata ttatatgagt attttgagta tatggatggt aaggagataa 2160 agttcgattattttatattt atttaaggat gtttgatgtt ttttttatgt ttatatttgg 2220 tgttatttatttaagtttaa tgattttgta aatatcgtgt tttatataat gtattttata 2280 atagtgttaagaatagtggt aagtgagaga gttttgtagg ttttttgata tagaatgaga 2340 gatgaagtaattatataatg taaatagaat ttttgaatat tttggtttaa ggaatatttt 2400 gtaaaattttgttgaagtat aatttatata ttatatgatt tatgaatgat tatttaaaat 2460 taaatattttttagtaaatt tatagatttg tgtatttaat atagtaatta gttttattta 2520 aaaaaaaaaaaaattttgta tattaattgt tattttttta tttgaatttt tgtatttata 2580 ttgtattgggtaattagtaa tttaattttt gtttttataa atatgtttat ttaggatttt 2640 tttaaaaataaatgaaatta tataatatgt ggttttttgt ggttggttat ttttatttag 2700 tttaatgtttttaaaggatt atttatagaa tagtgtatat aaggatttta tttttattgt 2760 tttttattagatgttattta taagtagaaa ttatttattt attttttagt ggatagatat 2820 tgatttttttttatttttgg ttattataaa tagcgtttat atttttattg ttaaatagta 2880 ttagatgttatttataaata taatttattt atttatttat tagtgtacgg atattgtttt 2940 ttttttatttttggttatta tgaatagcgt tgattaatat tgatgtatat gttttttgta 3000 gatatgtttttatttttttt gggtatatgt ttagaaaggt aattattgaa ttatgtggta 3060 aatatatgtgtaaatttttg aggaattgtt agattttttt atagtgggtg aataattttt 3120 tatttttattaataatgtat gagagtttta gtgtttttat taatttgtta aattttattt 3180 tttaaataataaaaaaggtt attttttatt ttaatttatt aatatatttt aatagatata 3240 aagaaaggaaagtttttttt tatatattgg agggaaaagg gaataaatta attattaatt 3300 tatttaatattttattgtaa aattgattat attttttttt gttaaaatta ttaaatgtaa 3360 agttaaaatgaagaaaatgt aaaagatttt ttattttttt gtaaatgtat tttggtatta 3420 agttttgatatgataatagt tatattagaa ggaggtaatg aaagtttttt atagagtttt 3480 tggtatatattgttagttgt aaatggatga tagtagatta aatgtataat aaatgtttaa 3540 tagattaagttgtttagata gtagtttatt aatgagaaat gatatttgta agaatgatat 3600 aaattttggaattttgttgt tttttataag ttttttgttt aaaatagtat atttatagag 3660 tttttgaatagtattagaat atttataata tgtgtttttt gtatttttga attatatgtt 3720 aaaatgtattttttggaaat ttgtatgttt atattttgat taattttata aaaatgaaat 3780 taagtttatttttagtaaaa gatgtgggat aaattttaaa tttaatagta aattgttgga 3840 attaatgaggatggaagttg aaggtgataa gtatagttat tttttggtgt ttttgagtaa 3900 gtttattaagtattattatt aaattgatat aaagattgta ttttattggt tatattagta 3960 tatttttataggatttagag ttagaatata attgttagta taagaaataa aaaagtttat 4020 tttttagataatttgttaaa atgttatttt tttttttaat tttttttaat ttggtatata 4080 ttaatgttaattaatgttat aatgatttaa gtgttgataa tagagttttt ggaaagtaag 4140 agaataaagaaaaggatgaa tgattttgtg tttgtatgtg tgaataataa atttattgtt 4200 atttgtttattgtaaatgtg gttgttttta gaataagaga taatttaatt gtatataaag 4260 agtttttagtataagaaagt attattttgt taataatgag gtagtggtgt gatttatttt 4320 tatttatttaaatattttta aatagaatat ttttattttt tttatgtagt tttatattta 4380 ttatattagttttattttat gttttttgat attgtttttt tgattgtaga aatttttttt 4440 atttttatttaaatagatat gttttaagta taattatagt tattttgttt tatttgaaaa 4500 tattttgtttaaattataat aatttttttt tttgaatatt tgtaatattg tttatatttt 4560 ttagttttagaaaatattta ttttttaaat gtttattatt taatttgttt tatagattgt 4620 tttgtaatttaggtaagttg tatttttaaa aagtttaaat agaaatttat attaagtaga 4680 attaggaaggaaaagatgta tgttataaaa tagagatatt tgtttttatt ttattaataa 4740 tttgttaatttgaaatgagg taaatttttt ttaaaaagat atttgaatat agtttttgag 4800 taaatattgtttgtagagtg gtaatattgt ttaatatttt taatgttttt gagtgtaggt 4860 attatgtgttatttagattt tttttttggg aatatagaaa ttatttttta gttgatgaag 4920 tgatgaataattgatatatt ttatttataa gttttttttt ttagtatatt tttgttgaaa 4980 gttatttagtatgtagtgat ttttttaaga tagttaatat ttaatgtttg gttatatgta 5040 ggattttaaaggtttatttt ttttatttta atttggatta attttgaagg gttaatttag 5100 ttttagaatttttagtgggt gagatgaaat ttatgttgag attgtatgtt ttagtatgtt 5160 tagggtgttatatagaaaaa tattatatat tggttagttt atagataata aatatttatt 5220 tgttatagtttttgaggttg aaagatttat tattaagatg ttggtattgg gtattttttt 5280 aagatggtaattcgttatta tgttttaatg gggaaaatag atgaatgagt tattgtgagt 5340 atattttttaaaagaattaa ttttattaaa taggattttg tttttatgat ataaatattt 5400 tttaaaaggttttgtttgtt aatataatta ttttggttat aagaatttta atatattaat 5460 tttgggggtatttagatatt taaattattg tattgaatta tgtattattt tgttttattg 5520 tttaattttgttttttattt ttttatagat gttattttta agaaattttt ttaattattt 5580 ttattaaaaaatatttagtt tagagtttat tttttggaag tatttaatat ttgataatat 5640 gtattaagagaggttagaaa aaaaagaata gataataaaa tgagatttta gagttggatt 5700 atatattattagttgtaatg agaattttat tattattggt atagagaata taaatagttt 5760 ttggaatgtgataatttaaa ttttttatat ttttagtaat ggtaaattat gttggtagta 5820 ttttgaaagggaaagtttta tttattagga tatattataa atttattaat atgggaaaag 5880 tagaaattatgattataata gaggtaaatg tttttttttg tagaattaat gtttgggaga 5940 aaataatggaagagtgagga ttaataatta ttaaattaag gtaaacggtg aaagttagaa 6000 aagtttttttggaagtgtta ttagaaaaag gggtttagat ttagatatta agagaaggtt 6060 attggattttatatagtaag gaatttaagg ttagttatag agtgtaatga gaagataatt 6120 tattgaaagttatgatatta tagagtaggg tatttttaga aggtaaggag ttgaatgtaa 6180 tatttttgttttaagttttt tttatgtagg agttttattt ttgtaaaggt taattaagtt 6240 gtgtttagttgtgggtggtt agataatagg ataaaattga ttattttatt tatgttaaga 6300 aaattatttttgatattttt ttgtgtgaat atattaaaat ataattgtta ttattttgaa 6360 attatgtatcgttttgggta ttgggatatt tggatttttt attgtaggtg tgtgtgttta 6420 tagggagttgaatttaaaat tatattattt tgtttttttt tagtttttgt ttttttaatt 6480 gtagtatatatagagatttt tattttatgt agaagtattc ggtttttatt attaaatgaa 6540 tttgaattttaagtttagga ttgaatttta aaaataagtt tagtttagtt ttagttgaat 6600 ttttagtttagtttgattat taattatatt tagggtttta gtttagatag agtgaaatta 6660 taagatatttgagaaataat ttattgtagt taaaattttt agtttttaga tttttttgaa 6720 tttcgaatttgtaaaagagg tttatttttt tttgttaagg gatagtattt ttttattgtt 6780 tgaagatgatatagtgtttt tttttttgta ggatatttta tatttttntt tgtgatttgt 6840 atttggaatgattttaatta ttgtaaatgt atttagtttt gttttataat aaaggttgtt 6900 gttgattttagattatgttt tatgtaaaaa tgagtggaat gtaaatttta tggttgtggg 6960 gtggagtgttttgtagagtg ttaggtttaa ttggttaagc gttaagttta agtttagagt 7020 ttttt 702547 6048 DNA Artificial Sequence chemically treated genomic DNA (Homosapiens) 47 gtgggttaaa taaaatgtta taggttatag ttttagtttg gtggttgttgatttattgat 60 tttgttataa tattggaggt taggattttg ggtaaatgaa agagaaaaggaggtagattg 120 agaatgtgat tttataattt tagttttttt aggggttggg tggttagtgtttttttagta 180 gttttttttc gtaggaagta gaattgtttg taacgttgat ggagttatagtaatttttat 240 tttattgagt ttaggatttg tagagttatt aagattttgg agtaattgtttttagtattt 300 aatagaagtt gttaaaagga ttatgggtta atttatttta gatattttttttagatgttt 360 ttatggaaag ttagggttta aattagtggt ttttattttt ggtagtatttgagttttatt 420 tggggaattg ttagaaagtg aaatttggac ggtatttata ttagtttagtttttgggtgg 480 ggtttggata ttagtatttg tagaagtttt ttaggtggtt ttggtgtagttaggttggaa 540 attattgatt taattaatag aaatgttagg ttgggatttt tttcgaggtatttttttagg 600 ataggttgtg tatgatagtt ttatagtgtt agggttttaa gatgttttaatggtttaggt 660 attggtttta attttcgttt tttcgttttt tttgagattt taataaattttatagggttg 720 ggtataatgg tttacgttta taattttagt attttttttt tttttttttttttttttttt 780 tttttttttt tttttttttt tttttttttt tttttttttt ttttttttgagattgtttta 840 ttttgtcgtt taggttggag tgtagtggta taattttggt ttattataatttttattttt 900 taggtttaag cgattttttt gtttaagttt tttaagtagt tgggattataggtttttgtt 960 attatgttta gttaattttt gtatttttag tagagatagg gttttattatgttggttagg 1020 ttggtttcga atttttgatt acgtgatttt tttattttag ttttttaaagtgttgggatt 1080 ataggcgtga gttattgcgt ttggttaatt ttagtagttt tagaggttaaggtaagagga 1140 ttttttgagt ttaggagttc gagattagtt tgggtaatat ggtaagattttattttaatt 1200 taagaaaaaa attaaaatat ttaagtttta taatttttat atttttattgattgattaag 1260 tgtagataat gatatttgtt tttttaattt tattaggttg ttattaggagaaatgaagta 1320 ataaatgaga aattgttttg taaattgtta acgttatgta aatattgttatttagagtgt 1380 gtttttaggt gcgggaggta tagttgttat ttgttggaga ttatttttgaagtaatattt 1440 ttagtgttat gggttagatg ggaattggta tagatatttt aatttagaaggtagttttta 1500 ttgttttata agtaggtgcg ttttttgggg tggtagtttg gtattggttattttaatttt 1560 aatttgtgta ggaggtatta tagtaaatga gtagagagag tttaggggatttgaagggaa 1620 gtggagggtt atttggagag ggagggaatt aaggattttt tgtgggttggggtttttttg 1680 aggatttagg gagtaattgt taaggagttt tagtagggat ttaagagttatgtaagagta 1740 aaaagaggta aattattaag gaaattagtg aagttagtat tggaataatagagaggggat 1800 atagtagtgt agtatgggtt ttggttttag gaagttgttt gattggggtagataggatta 1860 gttttttaga agatagttat ttatattagt taggtagtta tgatttagtgttatttattt 1920 gaggtttagg ttgtatgagg ggttgggggt gggatggata gagtattggttgggtattag 1980 gattaggttg gagttttggt ttaaaatttt attataattt gatattgggtaagatggttt 2040 atttgtggta ttttaggttt ttgttttgta aagaggagtt tgggtgtatatttagatgga 2100 ttgtgagtat agtttgagtt tgttttgtcg aggtgttgag gtttgggagattggggtgag 2160 tagttgtggt ttagggaagg ttggtaagtt gggttttaga tgagaggggatgtttggtta 2220 ggtagaggtg agtggagaag gtagggtaag gaagggaata tgagcggcgaataaatggag 2280 tggatatggt gggggtagag gatggtggga agtggttttg ttgcggttagagtggaggaa 2340 gagataagtg ggaaagagtg gagtcgatta tagaaggttt cggaaattaggtagagatgt 2400 ttaaattggt ttttttagga aggagagggt tatgaaggga tttagggaagggttatgata 2460 tgattatgtt gtattttagt aggattaatg tgatttggtg tttagaatgatttggatggt 2520 atgaggttag gagtcgagga ggatagttag aagatttttg taatatttttggtataggga 2580 gatggattgg gagttgggag gtggtaatag gttaggttta gagatattttttaggaaata 2640 ttgataggtt ttggggtttg gttgtattta tggagtgggg aggaatgagttattttgaga 2700 agtagttttt tttttaaagg ttagggaaga taaagtagag gtagtttttttgtttgtaaa 2760 taggatattt tagggtaatt tggttttttt aagcgttagt ttttttttggttttagttta 2820 gataggagtt gtaataacgg gttgggtatg ggtgatggta tcggttggtggttgggttaa 2880 gggttatgtt tttgattatg tattaggttt atttagtttg ttaagtgttaggttttgcgt 2940 ttgtgtagga gatagagtaa ttagtaaaat atagtttttt atttttaaggagtttttagt 3000 tttgtgagtt tggtagattt gtagaattta aatgaaatgg tagttgagaataattatttt 3060 gtttttattt attttatttt gtttaacggt tatgtaggta gttttaaatgtttgatgtgt 3120 attagaaaat tttttttttt ttggtttata attatgattt agggtaaatttaggttttgt 3180 tgggtttgaa aattaaataa attggtattt tttatggaaa ataatttaaatataaatata 3240 taaatattat attgttaggt ttttttaggg ttagtaaggg taggaatgaaagtgagagtt 3300 tttgaagttt taatcgtatt aattttttag ttagttttat gatatttgttattttttaag 3360 tgtgtattat gtgtacgtat tttgcgtata gtattatata ataattaaggggaggtgagg 3420 tgggtattag tgtttttatt ttatggatga agatatagtt ttagaggtgatttaagatgt 3480 ttttttgtat aggttttaag gtaaggggtg gggattgtga tttggataggaagttggggt 3540 tttaggattg tatttaagtt tttttttttt tgtgggtgat ggtggttgttaggttttgaa 3600 tttacgttat tttttttttt gatttgattg tatttttgtt aggtttggttaagggttagg 3660 gatttttaaa gttaagagtt agggtagagg ttgggggttg gattttagggtattatatgg 3720 tcgagatttg gttgtaggaa agtgatttat ttaggtagag gggttttatataattgggat 3780 tatagtaaat tttagaggtg agtatttgtt ttaaagattt atagatttaagttgtgattt 3840 tagatttata attttttggt tgtataaagt ttagtaagat tgaggttttattgagtttta 3900 atttttttat ttgtttaatt agaatagtaa taatttgttt gtatatttgagtttattata 3960 tgttattttg taaggtatta aagtttttgg aggttttcgg aatatagaaataattaattt 4020 aagaatttta aagtggttgt tttggtagta tttttaggga gtttttttattttacgtaat 4080 tttttttggg aaagtagaaa atacggtatt tgggaagggg cgttgaatcgtgttttaagt 4140 tttagtgggt ttggatgttt aagagtaaga ggaggtttag aggatggggataggttacga 4200 tttgtggttt aagtttcgtt tagagggagt gcgttttgag ggagagttatcggagttggt 4260 gattcggggg cgggtgtttt ggggtgtcgt tttgggttta gtaatataaatttgttagtt 4320 ggagattagg cggggtacgt cggggagagg tgatgtattg tcgttgaagatttaggtagg 4380 tcggtgcgtt cggtttgggt gaggaaggcg cgggattcgg gtgcgaggattgcgtagcgt 4440 tttcggtttt cgttttcgtt cgttttttac gtttattttt gtaagtttttttcggtattt 4500 cggcgtttat cggattttta gggcgagttt ttattttcga ggaatgggatcgttttcgtt 4560 tttcggggtt gttagttttt agattacgtt taggggtttt ttcgattcggagtcgggcgg 4620 tgttttttgt ttgcgtttcg tattttttcg tttggtacgg ttattcgggtacgcgtcgtt 4680 acgcgtgaag gttcgtatcg gttttttacg tgggggacgt gtaggatgatgcggggtcgg 4740 gggggatttc gttcgtcgtt cgtttttttt tcggcgtagg agggagcggtcgattcgttt 4800 tcgtttttcg gtcgggacgt tatcgtcggg cgttgtagag gcgcgtcgtaattaatgggc 4860 gtggaggagg tgggtcggtt ggcggttgtt attttttagg ggacgggagcgcggagatcg 4920 ggcgaagacg gagttgtcgt cgcgtttcgg gtcgaggggg aggagtcgggggaggaggag 4980 gaggaggagt cgtcgagtag tcgtcggagg attacggttc gttagggttgcggaggatcg 5040 atcgttttta cgtttgtcgt ttcgcgattt cgatcgttag tatgatcgtcgcgtagtttt 5100 tggtttatta ttttacggag ttgaaggatg attaggttaa aaaggtgagttttcgttcgc 5160 gtcgtcgttg gttttggtcg tagttttgcg tttcggtatt cgttcgtcgttttcgttgtt 5220 tttatttttc ggcgttcggt ttttttcggg ttagtatcga gttggattgtagggcgtaag 5280 gaaagttttc gttttcgatt ttatcggtat tgttagtgtt tttgtgtgtgtgcgtttttg 5340 ggaggggggt aatcgggcgg aagatttcga gatcgggttg tttgttgtagtgtttttgaa 5400 acgggttttg gatgttagat aggttttcgg gttgtgcggg gaggtggtcggtggtttttt 5460 cgtaggtttg ttcgggaggg ttcgagcgtc gtgggaggag gtgtgttatggagatgttgg 5520 ggaggtgatc gagtagtagg cgngggtgtt ggttggaggt agttttttatatttngggtt 5580 ttggcggagg tgtcggtgtt cgaaaaaaaa attaaaatgt ttttaggtatttgttgttat 5640 tttaaatgaa gttttaaagt ggtgtttttt tggaaaggta ttgtagttggggagtttatg 5700 aatttggggt gggttatttt tggttgtgtg gttttgtgta agttttttaatttcgttgag 5760 ttgtagtgtt ttttaaatat agaatgaaga taattatatt tattttttagaattgtttgg 5820 gggatttaat aagataatgc gtataaagta tttggtatag cgcgaggtatagtgttaaaa 5880 tcggaggtac gtgtttttat tattattatt gagaaagatg ttggtgggtatttaatatag 5940 ataaatgata aaattttgga tggataaatt attcgtttat atttttcgttgttaagttat 6000 taagaaagta tgtgtattta atttttaaag ttgaatgaat ttttatag6048 48 6048 DNA Artificial Sequence chemically treated genomic DNA(Homo sapiens) 48 ttgtgagaat ttatttaatt ttaagaatta aatgtatatg tttttttgatagtttggtag 60 cggagggtgt gaacggatgg tttatttatt taggattttg ttatttatttatgttgaata 120 tttattaata ttttttttaa taataatgat aaaagtacgt gttttcggttttgatattgt 180 atttcgcgtt gtgttaaatg ttttatgcgt attattttgt taaattttttaaataatttt 240 aagaggtaga tatgattatt tttattttat atttgagaaa tattgtagtttagcgaggtt 300 aagagatttg tataaagtta tataattaag agtagtttat tttaagtttataagtttttt 360 aattatagtg tttttttaga aagatattat tttagaattt tatttaaaatggtagtaggt 420 gtttgaaagt attttgattt ttttttcggg tatcgatatt ttcgttagaatttnaaatat 480 gagaggttgt ttttagttag tatttncgtt tgttgttcga ttatttttttagtattttta 540 taatatattt ttttttacgg cgttcggatt ttttcgaata ggtttgcggaagagttatcg 600 gttatttttt cgtatagttc gggggtttat ttgatattta gggttcgttttaaggatatt 660 gtagtaggta gttcggtttc ggggtttttc gttcgattgt tttttttttaaaaacgtata 720 tatatagaga tattgataat gtcggtagaa tcgaaggcga aggttttttttgcgttttgt 780 agtttaattc gatgttggtt cggagaaggt cgggcgtcgg aggatggaggtagcggaggc 840 ggcgagcgga tgtcggaacg taaggttgcg gttaggatta gcggcggcgcgggcgggggt 900 ttattttttt gatttggtta ttttttagtt tcgtgaagta ataggttaggagttgcgcgg 960 cgattatgtt ggcggtcggg gtcgcggggc ggtaggcgtg gggacggtcggtttttcgta 1020 gttttggcga gtcgtggttt ttcggcggtt gttcggcggt tttttttttttttttttttt 1080 cggttttttt ttttcggttc ggggcgcggc gatagtttcg ttttcgttcggttttcgcgt 1140 tttcgttttt tggagggtga tagtcgttag tcgatttatt ttttttacgtttattggttg 1200 cggcgcgttt ttgtaacgtt cggcggtggc gtttcggtcg gggagcggggacgggtcggt 1260 cgtttttttt tgcgtcggaa agggggcggg cgacgagcga aatttttttcgatttcgtat 1320 tattttgtac gttttttacg tagggagtcg atgcgggttt ttacgcgtggcggcgcgtgt 1380 tcgggtggtc gtgttaggcg gggaggtgcg aggcgtaggt aggaggtatcgttcggtttc 1440 ggatcgaaga agtttttagg cgtagtttag ggattggtag tttcgggggacgaaggcggt 1500 tttatttttc ggaaatgagg gttcgtttta ggagttcggt ggacgtcgaggtgtcggagg 1560 ggatttgtag aagtgggcgt ggaaagcggg cggaagcggg agtcggggacgttacgtagt 1620 tttcgtattc gggtttcgcg ttttttttat ttaggtcgaa cgtatcggtttatttgggtt 1680 tttagcggta gtgtattatt ttttttcggc gtgtttcgtt taatttttagttggtagatt 1740 tgtattgttg aatttaaagc gatattttag agtattcgtt ttcgagttattagtttcggt 1800 ggtttttttt tagggcgtat tttttttggg cgggatttgg gttataggtcgtggtttgtt 1860 tttatttttt gggttttttt ttgtttttgg gtatttaggt ttattgggatttggggtacg 1920 gtttagcgtt tttttttagg tgtcgtgttt tttatttttt tagaggaagttacgtaggat 1980 gggaggattt tttagaggtg ttattaggat agttatttta ggatttttagattaattatt 2040 tttgtgtttc ggaagttttt aggagtttta gtgttttata aaatgatatgtaatgagttt 2100 aaatatataa ataagttgtt gttattttgg ttagataggt aaggaaattgaagtttagtg 2160 aggttttagt tttgttggat tttatatagt taggaagttg tagatttaggattatagttt 2220 ggatttgtga gtttttgaag taggtgttta tttttagggt ttgttgtggttttagttgta 2280 tagagttttt ttgtttaaat aggttatttt tttgtaatta agtttcgattatatggtgtt 2340 ttgagattta atttttaatt tttattttag tttttgattt taggagtttttagtttttga 2400 ttaggtttag taaaggtata gttaaattag agggagggat gacgtaggtttagggtttga 2460 tagttattat tatttataga aaaggaggag tttagatgta gttttgaggttttagttttt 2520 tgtttaggtt atagttttta ttttttgttt tagggtttat gtagaggggtattttgaatt 2580 atttttgaga ttgtgttttt atttataaga tgaagatatt aatgtttattttattttttt 2640 ttgattgttg tgtaatattg tacgtaaaat acgtgtatat aatatatatttaaggaatgg 2700 taggtattat agaattgatt gaaaagttaa tgcggttaaa gttttagggatttttatttt 2760 tatttttatt tttattagtt ttgggagggt ttagtagtgt gatatttgtatatttatatt 2820 tgaattattt tttatagaga gtgttaattt atttaatttt taagtttaataaaatttgga 2880 tttgttttgg attataatta taaattagga agagagagat tttttggtatatattaaata 2940 tttggaatta tttatatggt cgttaagtaa aatggagtga atgagaataagatggttgtt 3000 tttaattgtt attttatttg agttttgtag atttgttaag tttatagggttggaaatttt 3060 ttgaggatgg aggattatgt tttgttaatt gttttgtttt ttatataagcgtagggtttg 3120 gtatttggta ggttgaataa gtttaatgta taattaaaaa tatggtttttaatttagtta 3180 ttagtcggtg ttattattta tgtttaattc gttgttataa tttttatttgagttggagtt 3240 agggagaagt tgacgtttgg aagagttagg ttattttgaa atgttttgtttgtaggtagg 3300 aaagttgttt ttgttttgtt ttttttggtt tttgagaggg aaattgttttttaaggtgat 3360 ttattttttt ttattttatg aatgtaatta ggttttaagg tttgttaatattttttgaga 3420 aatgttttta ggtttgattt attgttattt tttaattttt agtttatttttttgtgttag 3480 aaatattata agagtttttt aattgttttt ttcggttttt ggttttatgttatttaagtt 3540 attttgagta ttaggttata ttaattttgt taaaatgtag tataattatgttatgatttt 3600 tttttaaatt tttttatggt tttttttttt ttgagagagt taatttaaatatttttgttt 3660 ggttttcgag gttttttgta atcgatttta ttttttttta tttatttttttttttatttt 3720 ggtcgtaata aggttatttt ttattatttt ttgtttttat tatgtttattttatttgttc 3780 gtcgtttata tttttttttt tgttttgttt tttttattta tttttgtttgattaagtatt 3840 tttttttatt taaggtttag tttgttaatt ttttttggat tatagttatttattttaatt 3900 ttttaggttt tagtatttcg atagggtaaa tttaggttgt gtttatagtttatttggata 3960 tatatttaga ttttttttta tagggtagga atttgggatg ttataggtgggttattttgt 4020 ttagtgttag gttgtggtag agttttgagt taggatttta gtttagttttgatgtttagt 4080 tagtgttttg tttattttat ttttaatttt ttatgtaatt tgggttttagataagtaata 4140 ttgagttatg attgtttaat tgatatgggt gattgttttt tagggggttggttttatttg 4200 ttttaattag atagtttttt gaggttaggg tttatgttgt attgttgtgttttttttttg 4260 ttgttttagt gttgatttta ttaatttttt taataatttg tttttttttgtttttgtata 4320 gtttttagat ttttgttaag gttttttgat agttattttt tggatttttaggaagatttt 4380 aatttatagg gagtttttag tttttttttt ttttagatgg ttttttatttttttttaagt 4440 tttttgaatt ttttttattt atttattgtg gtatttttta tataagttggggttggagtg 4500 attagtgtta ggttgttatt ttaggaaacg tatttgttta taagataataaaggttgttt 4560 tttaagttgg aatgtttgta ttaattttta tttgatttat ggtattaggaatgttatttt 4620 aggagtgatt tttaatagat aatagttgta tttttcgtat ttgggagtatattttgaata 4680 gtaatgttta tataacgttg atagtttgta gagtaatttt ttatttattgttttattttt 4740 tttgataata gtttggtgag gttagaaggg taaatattat tatttgtatttaattagtta 4800 atgaggatgt gaaggttata gagtttgggt gttttggttt tttttttaaattgaaatgag 4860 gttttgttat gttgtttagg ttggtttcga atttttggat ttaagggatttttttgtttt 4920 gatttttaaa attgttggaa ttggttaggc gtagtggttt acgtttgtaattttagtatt 4980 ttgggaggtt gaggtgggag gattacgtgg ttaggagttc gagattagtttggttaatat 5040 agtgaaattt tgtttttatt aaaaatataa aaattagttg ggtatagtggtaagagtttg 5100 tagttttagt tatttgggag gtttaggtaa gagaatcgtt tgaatttgggaggtggaggt 5160 tgtggtgagt taagattgtg ttattgtatt ttagtttggg cgatagagtgagatagtttt 5220 agaaaaaaag aaagaaaaga aaagagagaa gagaagagaa aagaaaaggaaagaagaaaa 5280 agaaaaaaag aaaaaaatgt tgggattata gacgtgagtt attgtgtttagttttataga 5340 gtttgttaag gttttaaaga gagcgaaaaa acgaaaatta agattagtgtttaaattatt 5400 ggagtatttt agaattttga tattatggga ttgttatgta tagtttgttttaaagagatg 5460 tttcggaaga gattttaatt tagtattttt attagttgga ttagtggtttttaatttggt 5520 tgtattaaag ttatttaggg agtttttata aatgttgatg tttaagttttatttagagat 5580 tggattaatg tgaatgtcgt ttaagtttta ttttttaata gttttttaggtgaaatttag 5640 gtgttgttag gaatgaggat tattgattta gattttagtt ttttatgggaatatttggaa 5700 gaaatgttta aaatgaattg atttataatt tttttagtag tttttgttggatgttgaagg 5760 tagttgtttt agggttttag tggttttgta gattttgagt ttagtggggtgaaggttatt 5820 gtgattttat tagcgttgta gatagttttg ttttttgcgg gagaaggttgttgaggagat 5880 attggttatt tagtttttgg agaggttgga gttgtaaaat tatatttttagtttgttttt 5940 tttttttttt tatttgttta aagttttgat ttttaatatt ataatagggttagtaaatta 6000 gtaattatta agttaaaatt gtggtttgta atattttatt tggtttat6048 49 9265 DNA Artificial Sequence chemically treated genomic DNA(Homo sapiens) 49 ttttattaat aaagggttgt tttgttttaa gggttttttt agatgttagatatataaaat 60 ttttaagttt tagtgttata aattttatgt gaaaatttag gttgttggggagtttatttt 120 ttaaagttta gtataaataa agttatataa tagtaaatga tatatataaatagtaaaagt 180 aatattatat tttttatttg gaaagaaaaa atattaattt ttgaaaataggtagaaattg 240 agggaaaaga atgattttaa ttggtattcg agattttgat aatgttaatatttagaatat 300 tattaatttt agtagtagtt tgttgtttta tttttttttt tttttttttaataggttttg 360 atttattttg gagaggagta ggaagtaata tgagtaggaa tttttgggaggttagaataa 420 ttaatttgcg tatggtgagt aattgttttt ttatattatt ttttaaaatagatatgttat 480 ttatttagaa ttatagtttt ggaagggaat ttatgaatgg tataggtgaggagattgtag 540 attggtttaa ttgagtgatt ggttttagaa tttagttaag tttattaagtaatacgaaag 600 tattagattt ttaaagattg aattatagtt tttattataa atagttaatgttaaaaatgt 660 taatattttt tttttatttt aaaagagtat ttttaaaata ggtttttatagttttgatag 720 tgagaataat ttgttttatt tttatttatt gaatatttta aaaataatttgtttattgtt 780 aattaagttt tttttttttt ttaggattgt cgaaagaaat ataaagacgtaaaaaggaaa 840 atgaaattaa aataataaat gttagttggt tttgatattg aatgtgaataaggtttattt 900 aaggaaattg atttagaaaa tagttttagt tgataaagaa gaaattttagagtgaaggaa 960 ttttaaaaat ttggttgacg gaatattatt ttggttgtta tttttttttgtggaattttt 1020 ttgtattttt ttttaagtaa ttattttaaa aattaaattt aattttttataaaggaagaa 1080 taagatagtt tttgaaaata ttttttgtat ataatttttt tgttttttattttgagtaat 1140 taatggatat ttttttatgt aaggtttata tgaagttttt ttaaataaatgagttaaagt 1200 atttgtattt tttagtttag gttttgtgtg aattataggt tatttgaaattttatttttg 1260 attatgttaa atatattttt tattttgtta tttttgttta aattgataaattataagtta 1320 atattgagtt ttatatttgt gttttggtga atggttaatt gaaatataggatattttaga 1380 ttaatattat ataagagttt tgtgaggatt aggagaggaa gttaaatatagttattttgt 1440 tattgttttt aggaattaag gaataatatt tagatgtata ttaattttaaaattttagtt 1500 agattaaaag tttatgaaaa atattaagtg tttgaaagat aggtagttataattaggagt 1560 taggattttg agtttaaata gggaaataga tttaatatta tattaaataaattaatttgt 1620 ttagatttta agatatacgt tttttattaa aatgggtttt gtatgaaatagtattatata 1680 ggtcgggcgt gatggcgtat atttgtaatt ttagtatttt gggaggttaaggcgggcgga 1740 ttatgaggag gttaggattt taagattagt ttggttaata tggtgaaattttatttttat 1800 taaaaatgta aaaattagtt gggtgtggtg gtttatattt gtaattttagttgttaggga 1860 ggttgatata ggagaattat ttgaatttag gaggtagagg ttgtagtgttgagattatgt 1920 tgttgtattt tagtttgggt aatagagtga gattttattt taaaaaaaaaaaaaaaaaga 1980 aatagtatta tatagtttta agggattatt attaagttat gatgtgtgtatttaaaatta 2040 gtatttattg atttatttat gttgaatata aatttttaat tgttgggattttatttggtg 2100 tgttaattat tatgatttta gggtttatgt tttatgtttt tttagtaagggtttaaggaa 2160 ttaaataatt tgaagagtaa ttttggattt ttaggttttt aaaattttagattttaagga 2220 gagtgtggat aattaagtag taggataaat aatttatatt ttttatttttttttgatgta 2280 gattatattt gtattttatt ttttattgtt gtatagtaaa ttattttagtaataattatt 2340 tattttatgt ataaatattg taatttggtt aatatttatt agggattgttgatttgtgtt 2400 gtgtgttttt attggggtgg tttagttagg gttacgggat ttgtttttaagatggtttat 2460 ttagtgtttg tttatgggtt tttttatagt atagtaaaaa agttttaggagtaagtgttt 2520 ttagaggtag gaagtagatg ttgtttgttt tttaaggttt ggtttagaaatcggtttagt 2580 tattttattg tattttatag gtttaaattg atatatagtt taattagattgaaagggagg 2640 ggatatagat ttttattttt tagtgggagg agtgttagaa tgtgtggtcgtaatttaaat 2700 tcggtatatg ttttataagt agataaataa gtaatattaa gtagttttgtttatttttta 2760 gtttttgttt tttagatgaa attattttta gtaatttaat ttttttagtatttattttta 2820 tgtttttatt taatatgttt atgttttgat tttttggttt tttatttttagatattatat 2880 attttgaaaa ggtgaaaaaa ttatttattt ttttagttta agtaatatattttgattata 2940 gttaattttt ttgttggaat ttttttattt gtttaatttt ttttagatttagttttttta 3000 tattttttaa ttgtgggata tgatgaggtt tttttttaaa tagtttgattaattttttat 3060 tttttaattt atagtgtttt tttttttttt tttttttttt ttttttttttgtttttgtta 3120 tatgtttaga taggttatag tattaggcgt tattagtatt agttcgtattttttattcga 3180 agagaagatt agttttttag tttattatag atagtttttt ttttttttttttttttttta 3240 cgtgtttatt ttatttaaag aaagttaaaa tgtttagtta attgtggttattttagattg 3300 tgaggtttaa tttcggttaa tggagaaagg gtataggggt agggtttgtgttagggataa 3360 aggttttcgt gtttttttgt tttggtgtgt ttttatggtg attggttaaggagaagtatt 3420 tttttgcgta gaagtaaaat tgttttgttg aaaatttttt gtttgaatgtttaatttttt 3480 taggattttg agtattattt ttaatataat agtattatta atataaatgttttttaatta 3540 aatttttaaa taattagatt tggtttattt tatttttgtt taggagttttttgtttggtt 3600 ttatttgggt tttttggata ggtgataaaa atgaattgaa taaggtggtaacgtgaggaa 3660 tgtgaaaatt ttaaatatat tttaaatatt tttagttaat taataagatttgtagttatt 3720 aaattatgta cgttatgtga gtatagttag aatattgagt tatttatgatggaggatatg 3780 aaattatttt aattttttat atagggttaa gacggtaagt aaagttaaatatatgttgaa 3840 tagattatta aaatgttttt aaatttaata agaaattgta ttttatttattttaggttag 3900 ataaattttt tatatttttt taacggatat aataggtagt tacggaattatttttaattt 3960 ggtaagattt agaatttttt ttagaggttt tggggttaaa gttcgaggtttattgttttt 4020 tgtaaggttt tagattttaa ttagtagatt agtaaggtat taagtcgatttatagtaatg 4080 ataataagta tgtaggtcgg gtgtagtggt ttatgtttgt aattttaatagttaaggagg 4140 ttaaggtaag tagatcgttt gagtttacga gtttgatagt agtttaggtaatatagtaag 4200 atttcgttgt tatagaaaat ataaaaatta gtcgggcgtg gtggcgttagtttgtagttt 4260 tagttatttg gttagggatg aggtgcgagg attatttgat tcggggaggttgaggttgta 4320 gtgagttatg atcgtgttat tgtattttag tttgggcgat agaatgagatcgttttttaa 4380 aaaaagaaaa aaaaatcgtt tgtgtaatgt ttttattatc ggaaatattttaagtaaaat 4440 ataataaaat ttttaaattt ggttgttaga tttttttttt ttttttgttattatcgtttt 4500 acgtagttat ttatgatagg agaagcggtt ttggggtcgg cggtttagggtttaaaagta 4560 taattattaa agttattttt tcggaagttg ttgtttgtcg ttattaatttaggtacgaag 4620 tgtttagtta gataaatatt gataaaagta aataagatga agaatatgagtttcgatttc 4680 ggcgtttttt tttagtgggt cgttatttat tcggaggtgt ttataattcgagtgagattt 4740 cggtttatat tattgtaacg gatataagta gtacgtatag cgtcgtttttagcgttggtt 4800 cgttttttac gtggaggcgt aaaattagta agtattattg tcgtattattcgagttagtg 4860 ggcgtaatta tgttcggcgc gattaatcgg cgtttggttt gttggtaggtgttaggtagc 4920 gcgtattgat tggtcggtgc ggagtttgtt ttttttattg gatttcgtatttttagcgcg 4980 ttgtattatt ttcgtgcgtt cggttgtagc gtggacgtcg gatgagttgtttttaggttt 5040 gttggttcgc ggggttgttt aggtacgcga ggttttttag gtacgtttttttttttttgt 5100 aggattcggt ttttaaagac gagggttacg tacgcgttat aatttcgaaatagtagtata 5160 agatttaatt tttaaaagag cgtgtttttt cggggtttgt cgttcgttcgtttttagttt 5220 taggaattta tggtcgtttt tttgaatgag gtagtgtttg aaatgagtaaaattttttta 5280 aaatgatata tatagtataa attgatatag ttgtgatttt atgtataggtaatacgtatt 5340 tttatatgtt ttaatttatt atttttaatg gttgcgagat atttattttattgatgtatc 5400 gtaatttatt ttagttatta tgaatattta gattgttttt agttatttgtttggagaaat 5460 aattattcgg tgaatgttat tgtatatata ttttgtatat ttgtatgagtatatttgtgg 5520 agtttatgtt aataggatat aattaaattg aggaaacgtt tgagacggttttatttttag 5580 gttatatttg atttaataga ttatgaagat ttgagaataa aaggagaaatagaaatggat 5640 ttagaggaga atgaaaaggg ggaatagaaa taggtttata ggtaggatttatatgatttg 5700 atgattaatt ggttgtgtgt attttttgag tagtgttagg ggtgatttaaaaatgttatg 5760 tttaagtaat gggaagaata ttggaattat taatatagta gtttaaaagggaagtaattt 5820 tggaaggaat tatgaaattt taaataaaat atggttttag tgtgcgtttttaaaatatat 5880 tgaggtaaaa taatatgaag taatgtgaat aatatgtagt taatattagggagggtggtt 5940 tcgaaattgt tgaacgggaa gttgaggtta aggtgatttg aaggagttgtggagtagcga 6000 agagttaagg gtttggatta taataagagg gaagtaaagg ggatggtatttttttgtata 6060 ataaggttgt tgtgtaaggt taatttgttt tgtttttgtt ttgtggttgttggatgttgt 6120 tgtgtatgga tagtttttta gtggattcga tgggttatag taattttgtgatttatgtat 6180 ggaggttgtt tttttttagt agttgttata gttcggtcgt tggtatatgattttttttga 6240 atagttaatg ttgttatatt gagtgtttat gtttgacgta ataatgtagtgatttttaat 6300 ttttggggaa agtagagatt ttttaaaaaa tatagtaaaa gttgaatgagttggttaggt 6360 atagtggttt atgtttgtaa ttttagtttt ttgggagttt agggtaagaggatcgtttta 6420 gtttaggagt tgaagattag ttagggtaat atggtaaaat tttgtttttataaattattt 6480 tttttttatt aaaaaaaaaa aaaaaaaaag ttgagtgtgg tggtgtatatttgtagtttt 6540 agttatttgg cgggttaaat tgggaggaat atttgaattt agggaggttaaggttgtagt 6600 gagttatgat tgtgttattg tattttagtt taggtgatag agtgagttattgttttaaaa 6660 aaaaaaaaaa aaaaggaatg attttttttt tagaaagttt aaattttatttttttaaaaa 6720 taaaaattta gatagatatt tttgaataat tgttagaata gtgtaagagtggtgatgttt 6780 agattttgat gtgaatgttt attttttagg gattttgtta aaatgtaggttttgattcgt 6840 aggtgcgagg tgaggttggt aagtttgtat ttttaataag tttttatagatgtgggttat 6900 agtaggatta gttttgaaga gattagaatg tgttggtatt taaaggtttgttagttttta 6960 gataataatt ttataagttt tagttggttt ttgataaggt atataatgaatttaaataaa 7020 ttagtaaatg tataaatatt tattttggtt tttgaaaggt tagaggttataataagagtt 7080 gaagatttaa aatgttttaa attttttgtt taatattttt taatggtatattgtgattag 7140 aaatagttat tttagttagt taaatagttt aattgttttt gttttgtttttttttaaatt 7200 aaatttagag gtatttatat atttgaaaaa ttaatgaggg taaaagaaaatgaaagatat 7260 tatttgttat agattttttt ttaaatgata atttgaatta ataatttgattagattatga 7320 tgtttttgat gtttttaaaa ttgtttgagg tatgtaggtg tttttttttgtagagttgat 7380 tattttggtt tgttgtggtt tttgagtatt taagattttt tattttttttgttgtttttt 7440 tattagtaat tttatttttt tttgatttga tattgatttg gaaagttcgttatttatttt 7500 gttagaattg ttaagtaaat ataaatagat tttgagaagg aaaggttttaagggtggttt 7560 attagatatt taagttatag attgattaag tatttttgta tgaggttattagtaaaatat 7620 ttaaaaagat attttaagat tttttttatt agggattaaa ttagaaaggtatagggttta 7680 ttttttataa aaattatgaa taagtaataa aaagggtaaa atggaaaattggaatttata 7740 tttgaatgtg agatttttat ttttttagtt ttaagatttt ttaagttttattagtttttt 7800 ttaaagagaa gatgaagtta ttttaagaga attgattttt gttatgtgagtgtaggtaag 7860 aaaattttta attattttga gatatttttt tttagattat taatgagttttttgtattat 7920 tagatagaat ttttaagatt tttttgttta tttttggaaa tattgtttttattattattg 7980 aatattaaat aatagttatg tatttttttt ttatattata tacgaaaataaaattatttg 8040 tggtttaaat gtaagcgaaa aatttataat tttgtttagg taatggtttattgatgatat 8100 taaaagttta agtagtaaaa ttaaaaattg ataaattggg tattattaaaatgaaaaatt 8160 tttgtgtttt aaaaaatgtt attaagaaaa taaaaagacg gtttatagaataggagaaat 8220 tttttataaa ttatatattt gataaaggat ttgtatttag gatgtatatataatttttaa 8280 aatttaatta taaaaagagt ttaattagaa aataggtaaa ggataaatatttatttaacg 8340 tggatacgta aatggttaat aagtatgtgg aaagatgttt agtattattagtttttaggg 8400 aaatgtaaat taaaattata agatattatt taatattttt tagaatgattgtaatttaaa 8460 gatggataat aagatgtgtt gggtaagatt tgaagaaatt agaatttttatttattgttg 8520 agggaatgta aaatagtata gttattttgg aaaaattttg gtatttttttaaaaagttaa 8580 atatagaatt attatgtgat ttagaaattt tatttttagt tataaatttaagagaaatga 8640 aaatatagat ttatataaaa ttttgtatgt gaatgtttat agtagcgttattcgtaataa 8700 ttaaaaagtg gaaataatat aggtatttaa gaaatgatga atggataaataaaatgtggt 8760 atatttatga aatggaatat tatttagtta ttaaaagtaa tgaagtatgaatatatatta 8820 tattatggat gagttttgaa aatatgttag agaaaggaaa ttagatgtaataggttatat 8880 atagatgatt tttataaatt tttttattta tatgaaatgt ttagaataggtaaatttgta 8940 gggatagaaa gaagataaat cgttgttatt ggttatggag aagaaagaatggggagtgat 9000 tgttaatggt tttggggtgt tttggtgggg aggggaggtt gaaaacgttttgaaattagg 9060 tattattagt tatattattt tgtaaatata ttaaaaagtt attgaattgtatatttttta 9120 tattatatta tgtaaattgt atattaataa agttgtaatt ttttaaaagtatggatagtg 9180 ttatgtatat ttatgttaat aatatggtat tttgttattt ttagattttttttttgatag 9240 taataaattt gatttttttt gtagt 9265 50 9265 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 50 gttgtaaaagaaattaaatt tattattgtt aaaagagaaa tttaggaata atagagtatt 60 atattattaatatgggtgta tatgatatta tttatatttt taaaaaatta tagttttatt 120 gatgtataatttatatagtg taatgtaaaa agtgtataat ttagtggttt tttagtatat 180 ttataaggtagtataattag taatatttaa ttttaaaacg tttttaattt ttttttttta 240 ttaaaatattttaaaattat tagtagttat tttttatttt ttttttttta tagttagtgg 300 taacgatttatttttttttt gtttttgtag atttatttat tttggatatt ttatataaat 360 gggaaaatttataggaatta tttatatgtg gtttattgta tttggttttt tttttttagt 420 atgtttttaaggtttattta tgatgtaata tgtatttata ttttattatt tttgatagtt 480 gaatagtattttattttatg aatatgttat attttgttta tttatttatt attttttgga 540 tatttgtattgtttttattt tttggttatt acgaataacg ttgttatgaa tatttatata 600 taaaattttgtgtggattta tgtttttatt ttttttgggt ttgtagttag aagtagaatt 660 tttgggttatatgataattt tgtatttaat tttttgagaa aatgttaaaa tttttttaaa 720 gtgattgtattattttatat ttttttagta gtgaatgagg attttaattt ttttagattt 780 tatttaatatattttattgt ttatttttga attatagtta ttttaggaga tgttaagtag 840 tattttgtggttttgatttg tattttttta aggattaatg atgttgagta tttttttata 900 tgtttattggttatttgcgt atttacgttg gatagatatt tattttttgt ttatttttta 960 attgggttttttttgtggtt gggttttaag ggttatgtat atattttgga tataaatttt 1020 ttattagatatatgatttat aaaaaatttt ttttgttttg tgggtcgttt ttttattttt 1080 ttgatggtattttttgaagt ataaagattt tttattttaa tgatgtttaa tttgttaatt 1140 tttggttttgttgtttgagt ttttggtgtt attaataaat tattatttaa ataaggttat 1200 agatttttcgtttatattta ggttataaat aattttattt tcgtatatgg tgtgagggag 1260 gggtatatggttattattta atatttagta atggtagaga taatgttttt aaaagtaagt 1320 aggaaaattttggaaatttt atttagtggt gtaaaaaatt tattaataat ttgaagaaaa 1380 atattttaaagtagttaaga atttttttat ttatatttat atgatagaaa ttagtttttt 1440 tgaagtaattttattttttt tttgaggaaa attggtaaaa tttaaaaaat tttaaagtta 1500 aaaagatgagaattttatat ttaaatatag attttagttt tttattttat tttttttatt 1560 gtttatttatgatttttatg aaggatgagt tttatatttt tttggtttag tttttaatga 1620 gagaagttttaaagtgtttt tttaaatgtt ttgttaataa ttttatgtag agatatttga 1680 ttaatttatgatttaagtat ttagtgagtt atttttgaga tttttttttt ttaaagttta 1740 tttatatttatttaataatt ttaataaggt gggtgacgag ttttttaagt tagtattaga 1800 ttagaaggggataaaattgt taataaggga ataatagaga agataaaaaa ttttaagtat 1860 ttaagaattataatagatta gggtaattaa ttttatagga aaagatattt atatatttta 1920 aatagttttgaaagtattaa aagtattata gtttaattaa gttattgatt taagttatta 1980 tttaaaaaaaagtttgtgat aagtagtatt ttttattttt ttttattttt attaattttt 2040 tagatgtgtgagtgtttttg agtttaattt aagaaaaaat aggataagaa tagttgggtt 2100 gtttaattaattgaaatagt tatttttgat tatagtatgt tattaaaagg tattaaatag 2160 aaggtttaaggtattttaga tttttaattt ttattataat ttttagtttt ttaaggatta 2220 aaataagtgtttgtgtattt attgatttat ttaggtttat tgtgtatttt attagaggtt 2280 aattgaaatttatgggattg ttatttgaag attaatagat ttttagatat taatatattt 2340 taatttttttaaggttggtt ttattatggt ttatatttat gggagtttat tagagatgta 2400 gatttattagttttatttcg tatttacgag ttagaatttg tattttaata agatttttag 2460 gggatgagtatttatattaa agtttgaata ttattatttt tgtattgttt taataattat 2520 ttaggaatatttatttgaat ttttattttt gagaaaataa gatttaagtt ttttgagaag 2580 aggattattttttttttttt tttttttttg agatagtggt ttattttgtt atttaggttg 2640 gagtgtagtggtataattat ggtttattgt agttttgatt tttttgggtt taggtgtttt 2700 ttttagtttagttcgttaag tagttaggat tataggtgtg tattattata tttagttttt 2760 tttttttttttttttggtgg ggagggggtg gtttgtagag atagggtttt gttatgttgt 2820 tttggttggtttttaatttt taggttaaag cgattttttt gttttgggtt tttaaagggt 2880 tgggattataggtatgagtt attatgtttg gttagtttat ttagttttta ttgtgttttt 2940 tagggagtttttattttttt taaagattaa gaattattgt attattacgt taagtataaa 3000 tatttagtataatagtattg attatttagg aagaattatg tattagcgat cgggttatgg 3060 tagttgttgaggagaagtag tttttatgta taaattatag gattgttatg gtttatcgaa 3120 tttattggagagttgtttat gtataatagt atttagtaat tatagggtag ggatagagta 3180 ggttaattttgtataataat tttgttgtgt agagggatgt tatttttttt gttttttttt 3240 tattataatttaggtttttg atttttcgtt gttttataat ttttttaggt tattttaatt 3300 ttaatttttcgtttagtaat ttcgagatta ttttttttga tattaattat atattattta 3360 tattattttatattattttg ttttaatata ttttagaaac gtatattaaa attatgtttt 3420 gtttaaaattttataatttt ttttagaatt gttttttttt taaattattg tattagtggt 3480 tttaatattttttttattat ttaggtatga tatttttgag ttatttttga tattatttag 3540 aagatatatataattaatta attattaagt tatgtggatt ttatttataa gtttattttt 3600 gttttttttttttatttttt tttaaattta tttttgtttt tttttttatt tttaggtttt 3660 tataatttattaagttaaat gtaatttgaa agtgggatcg ttttaaacgt ttttttaatt 3720 tagttatattttattaatat agattttata ggtatattta tgtaaatgta taaaatgtgt 3780 atataatgatatttatcgaa taattgtttt tttaggtaaa taattgaaaa taatttaaat 3840 atttatggtgattgaagtaa attacggtat attaataaaa taagtatttc gtagttattg 3900 aaggtaataaattaagatat ataaaaatac gtattgttta tatataaagt tatagttata 3960 ttaatttatattatgtatat tattttaaaa agattttatt tattttaaat attattttat 4020 ttaaaaaggcgattataaat ttttgaggtt ggaaacgaac gaacggtaag tttcgaagaa 4080 atacgtttttttaaaaatta aattttgtgt tattgtttcg gggttgtaac gcgtgcgtga 4140 ttttcgtttttgagggtcgg attttgtagg gaagagaggg cgtatttgag gggtttcgcg 4200 tgtttggatagtttcgcggg ttagtaagtt taaaagtaat ttattcggcg tttacgttgt 4260 aatcgggcgtacggaggtga tgtaacgcgt tgaaaatgcg ggatttagtg aaggagatag 4320 gtttcgtatcggttaattag tgcgcgttgt ttgatatttg ttaataagtt aggcgtcgat 4380 tggtcgcgtcggatatgatt gcgtttattg gttcggatgg tgcgatagtg gtgtttgttg 4440 gttttgcgtttttacgtgga aaacgaatta gcgttgaggg cggcgttgtg cgtgttgttt 4500 gtattcgttgtagtagtgta gatcgaggtt ttattcgggt tgtgggtatt ttcgggtagg 4560 tgacggtttattgggaaggg gcgtcgaggt cggggtttat gttttttatt ttgtttgttt 4620 ttgttagtatttatttgatt ggatatttcg tatttaaatt gataacgata aatagtaatt 4680 ttcggagaggtggttttaat aattatattt ttgggttttg agtcgtcgat tttaaagtcg 4740 ttttttttattataaatggt tacgtgaaac gataataata aaagggaagg aagggtttga 4800 taattagatttaaaagtttt attgtatttt atttaaaatg ttttcggtaa tgaaaatatt 4860 gtataaacgatttttttttt tttttttgag aagcggtttt attttgtcgt ttaggttgga 4920 gtgtagtggtacggttatgg tttattgtag ttttaatttt ttcggattag atgattttcg 4980 tattttatttttggttaagt agttgggatt ataggttagc gttattacgt tcggttaatt 5040 tttgtattttttgtagtaac ggggttttgt tatgttgttt aggttgttgt taaattcgtg 5100 ggtttaagcgatttgtttgt tttagttttt ttaattgttg ggattatagg tatgagttat 5160 tgtattcggtttgtatattt attattattg ttatgagtcg gtttggtatt ttattgattt 5220 gttggttaaaatttggagtt ttgtaaaggg tagtaggttt cgggttttgg ttttagagtt 5280 tttaaaggaaattttggatt ttgttaaatt gggagtagtt tcgtagttgt ttattgtatt 5340 cgttagagggatataaaaaa tttatttggt ttagaatagg tagaatgtag ttttttatta 5400 agtttaggaatattttgata gtttgtttag tatatattta attttattta tcgttttggt 5460 tttgtgtgaaggattaaagt ggttttatgt tttttattat gggtaattta gtgttttgat 5520 tatatttatataacgtatat aatttaatag ttgtaaattt tgttaattaa ttgaaagtat 5580 ttggaatgtgtttgaagttt ttatattttt tacgttgtta ttttgtttag tttatttttg 5640 ttatttatttagagagttta gatagagtta gatagagggt ttttggataa aggtgaggta 5700 ggttaagtttaattatttaa aaatttgatt gagaaatatt tatattaata gtattgttgt 5760 gttggaaataatgtttaaaa ttttaaggaa attgaatatt taaataaagg atttttagta 5820 aagtaattttatttttgcgt agaggggtgt ttttttttgg ttagttatta tgagagtata 5880 ttagaataaaggggtacgag aatttttatt tttgatataa attttgtttt tgtatttttt 5940 ttttattggtcggagttggg ttttataatt taaaataatt atagttggtt aaatatttta 6000 attttttttagataaggtgg gtacgtaaga gagaggggaa agggggaagg gttgtttgta 6060 atgagttagagagttagttt ttttttcgga taaggaatac gagttggtat tgataacgtt 6120 tggtattgtggtttgtttag gtatgtaata aaggtagaaa ggaaagagga gaaaaaggga 6180 agaggggggtattgtgaatt aaagaataaa ggattgatta ggttatttga agagaaattt 6240 tattatgttttatagttgga aggtatggga agattaagtt tagaaaaagt taagtaaatg 6300 aaaaaattttagtaaaaaag ttaattgtag ttaaaatata ttatttggat tgaagaggtg 6360 aataatttttttattttttt agaatatgta gtgtttggaa gtgaaaaatt aagaaattag 6420 agtataagtatgttaggtag aaatatggag gtaaatatta gagaaattaa attgttgaag 6480 gtggttttatttggggagta ggaattgggg ggtgggtaag gttatttgat gttatttatt 6540 tgtttgtttgtgaaatatgt gtcggattta aattacggtt atatattttg atattttttt 6600 tattaagaagtgaggatttg tgtttttttt tttttagttt ggttgggttg tgtgttagtt 6660 taaatttgtagaatatagtg aagtgattga gtcggttttt gggttaggtt ttaagagata 6720 ggtagtatttgttttttgtt tttgagaata tttgttttta gagttttttt gttatgttgt 6780 aaggaagtttatgaataggt attgagtggg ttattttaga aatagatttc gtagttttag 6840 ttgaattattttagtgaaag tatatagtat agattagtag tttttagtga gtgttgatta 6900 aattgtagtatttgtgtata aaataaatga ttgttattga gatgatttgt tatgtagtaa 6960 tagaaaataaggtataaatg tgatttatat taagagaagg tagaaagtgt gaattattta 7020 ttttgttgtttagttgttta tatttttttt gaagtttgaa gttttggaaa tttaggaatt 7080 tagaattattttttaagtta tttagttttt tggattttta ttaaaaaaat atagagtata 7140 agttttagggttataatggt taatatatta gatgaaattt taatagttaa gagtttatat 7200 ttagtataggtaaattaata aatattaatt ttaggtatat atattatggt ttaatgatag 7260 ttttttggaattatataata ttattttttt tttttttttt ttttaagatg gagttttatt 7320 ttgttatttaggttggagtg tagtaatatg attttagtat tgtaattttt gttttttggg 7380 tttaagtgatttttttgtat tagttttttt agtagttggg attataggtg tgagttatta 7440 tatttagttaatttttgtat ttttagtaga gatggggttt tattatgttg gttaggttgg 7500 ttttgaaattttgatttttt tatgattcgt tcgttttggt tttttaaagt attgagatta 7560 taggtgtgcgttattacgtt cggtttatgt aatattattt tatatagagt ttattttgat 7620 aggagacgtatgttttgaaa tttaggtagg ttggtttatt taatgtaatg ttaaatttgt 7680 ttttttatttgggtttaggg ttttgatttt taattgtgat tatttatttt ttaggtattt 7740 ggtattttttataagttttt agtttaatta gaattttggg attggtgtat atttagatgt 7800 tgttttttaatttttagagg taatgataag ataattgtat ttggtttttt tttttggttt 7860 ttatagaatttttatatgat gttggtttga aatgttttat attttagtta attatttatt 7920 aaaatataagtataaaattt aatgttgatt tgtaatttat tagtttaaat aaaaatgata 7980 aaatggaaggtgtatttgat ataattagaa ataaaatttt aaatagttta taatttatat 8040 aaagtttaggttggaaaata taagtgtttt gatttattta tttaaaaagg ttttatataa 8100 attttgtatgagaagatgtt tattagttat ttaggataga gggtaaagag attatatata 8160 aaaagtatttttaaggatta ttttgttttt tttttataag aagttgaatt taatttttga 8220 agtaattatttaggaagaaa tgtagaggag ttttatagaa aaagatggta attagaatga 8280 tatttcgttagttagatttt taaaattttt ttattttgaa attttttttt tgttagttaa 8340 aattgttttttgggttagtt tttttaggtg agttttgttt atatttagta ttaaaattag 8400 ttgatatttattattttggt tttatttttt tttttgcgtt tttatgtttt tttcgataat 8460 tttaggaaaaaaaaaagatt tggttagtaa taaataaatt gtttttaaga tgtttagtag 8520 atagaagtaaaataggttat ttttattgtt agggttgtgg aaatttattt tgaaagtgtt 8580 tttttgaaatgaagagggga tattggtatt tttggtatta attgtttata atgggaatta 8640 taatttagtttttaaaaatt tgatgttttc gtgttattta ataggtttgg ttggattttg 8700 agattagttatttaattgag ttagtttgta gtttttttat ttatattatt tatgagtttt 8760 tttttaggattgtaatttta gataggtaat atgtttattt taggaaataa tatggagaaa 8820 taattatttattatacgtag gttggttgtt ttggtttttt aagagttttt gtttatatta 8880 ttttttatttttttttagaa taagttagaa tttattaggg gaaaaagaag aaagatgagg 8940 tagtaaattattattaaaat tggtaatatt ttaagtgttg gtattattaa ggtttcgaat 9000 attagttaagattatttttt ttttttagtt tttatttatt tttaaaaatt agtatttttt 9060 ttttttaaatgaaaaatata atattgtttt tattgtttat atatattatt tattattatg 9120 taattttgtttatgttaggt tttaagaaat gagtttttta atagtttgag tttttatatg 9180 gaatttatggtattaaaatt taggggtttt atatgtttaa tatttaagga agtttttgga 9240 ataaaataattttttgttga tgaga 9265 51 5586 DNA Artificial Sequence chemically treatedgenomic DNA (Homo sapiens) 51 atttaggttg gaaggttttt ttttatatagtttattgtag tttttaaatt tttaggttta 60 agggattttt ttttttaagt ttttggaatagttgggatta taagtgtgta ttattatgtt 120 tggttaatat tttaattttt tgtagagataatgttttgtt atgttgttta ggttggtttt 180 aaatttttgg ttttaagtag tttttttattttagtttttt taagtgttgg gattatagat 240 gtgagttatt gcgtatggtt taggttttaggttttaataa gaatttttaa gtataattta 300 agttaggatt tttgggtttt aatttcggtattaaagtaaa tatagtttag tattaataat 360 gtgaattttt aatttggata atatagagaaattattgttt ttatataaaa ttagaaaatt 420 agggttaggt gtggcggttt atatttgtaattttagtatt ttaggaggtt aaagcgggag 480 gattttttga ggttaggagt ttaaggttagtttggttaat acggtgaaat ttcgttttta 540 ttaataatat aaaaaaatta ggtatagtggtatatatttg tagttttagt tatttgggag 600 gttgaggtag gagaattttt tggatttaggaggtagaggt tgtagtgagt taagatgtgt 660 attttagtat tatagtttgg gtgatagaaggagattttgt tttaaaaaaa aaaaaaaaaa 720 aaaattagtt aggtttggtg gtatttgtttgcggttttag ttatggggga ggtttaggtg 780 aaggattgtt tgagtttagg aggttaaggttatagtgagt tatgattata atgttgtatt 840 ttagtttggg gaatagaata agattttattttaaaaaaag aaaaaataaa ggtaaacgta 900 aattttaagt attttatttt ttatttagttaaaatatata tatatatata tattatatat 960 attaaggaga gaagatataa ttaatgtaaaataaaaattt taaaaattta gttggtatgg 1020 tagtatgtat ttgtagtttt agttatttaggaggttgagt ggggaggatt atttgagttt 1080 aggagtttaa ggttgtagtg agttgtgattttgttaattc gttttagttt gagtgataga 1140 gtaagatttt gttttaaaaa taaataaataaataaataaa aataaatttt ataattttga 1200 ggtagaatta ttattatttt aattttatagaagaggaaat tgaggttaag ttgtttaagt 1260 tatatagagg taattggtag agttggaattaattttagga tagtttaata ttaatgattg 1320 ggtttttgtt attatgttat gggtaataaatttagaatat aagggtttta tagattattt 1380 tttttttatt tttatagagg aaattgagatttttaggtga atgattttgt gttatttagg 1440 aagttagggt agaagtaaga tttgtatttaggtgttgatt ttaaatttta gttttacgtt 1500 ttagaaagtg agaaaattag aagattagggtggtttttgt tttataatgg agaaaaaagt 1560 tcggacgtag ttattagcgg ggggattaaggataggaaag tagtttggag tatagtggta 1620 ttaaagggta attattggat aattgttttttatttttaat ttttttttat ttttatttat 1680 ttgttttaag ttggagtttg tatgtgaggtttgaggaata atattataga tttatagaat 1740 tatggagtgt ttataggtag ggtattaggatagtgagaaa gaagtggagg gagagaggat 1800 tagttggagg aagtagttag gtttagtgagtttttttgtg ttgggttttt tattaagtat 1860 tggttattta aagttaaata agaaaaatttttttgttttt gaggattagg atagattgta 1920 tggaggagat gatatttgag taggttttagagtttgaaaa gatatagagg agggggcgaa 1980 aatttttgga tttatatgta attgtttatttgttagttcg atttaatttt ataaatatat 2040 tttaaaggtt ttttttgcgt tgggttttgttttaggtgtt gggattatag tggtgagtaa 2100 attagttgta gtttttgatt tttggttggagagtttgttt aggaagatag ttaaataatt 2160 ttaatatagt gtgagatgtg ttttatgtaaggaatttata aggtattgtg ggataaggga 2220 gtttaattgt ttttaggtta aaagtaagttttaatttttg aatatgaaaa aattttttat 2280 aatttaatgt tatttttatt ttttagttttatttattatt atttttttaa aagttgggaa 2340 tataataaag tatgtgtgtg tgtttgtgtatgtgaatttg aatatgttag gtttttgttt 2400 atattgtttt tgttttttgg tatatggatgtttttttgga gaaatttttt ttaatatatt 2460 tagttttatt taaatttttt tttgtgtttttaaggtaatt tgttttttta ggttgtttat 2520 ttgttttttt aggttggtaa agtttttaaagtaaggattt aaatgtaagg ttaagagtat 2580 ttattacgga gttatataga tataggtgggttttgtttag ttaagaggtt ttggttttta 2640 agttgttttt tttatttaga tgaattgttattattttagg aaatgtaatt agtattgatg 2700 tttagttttt ggtatatggt aggtgtttaaaaatgttttt tgagttgaat tgtattaata 2760 ttaaggttat aggttagaat ttgtattttatgaaggtttt ggttatgagt tggatttggg 2820 aagggtttat gattaatttt agtagttttttgtggttaaa aatgagaaat ataaattatg 2880 ttttttgttt tgaagatttg tttgttagtgggagaaatag atggttaagt ttttaatagt 2940 ataattttaa atttttagag tagtggtttttaaattttag taagtagatt agaattattt 3000 aaaggttatt tgttaaaata gatggttggttttagtttta gagtttttga tttaaaggtt 3060 tggagtaagt tttgagaatt cgagtttgtatttttaattt atttttaggt gatattgaag 3120 ttgttggatt gataagattt tttttttgattaaatattgg ttaggttttt ttgagttttt 3180 tttttgatta ggtttgagtg tgggtttttatgttattttt tgtggaattt tattttagta 3240 agaaatttgt taagttagtt tagttagaattttttatttt tgatatttga ttatttttta 3300 tatttggttt tgatttatat cgttattattttttaggtga tgtttagtta ttttgatttg 3360 ttttgggtag gaattttgtt aggttaatttagttagattt ttcgttaatg ttttttttta 3420 gtaatttttt atttattgat ttttatatattgttttttag ttataaatta ttattttgtt 3480 atatttagtt taatcgtttt gatttatggtaaaattttat ttttattttt gttagattgg 3540 gtttgaataa agtttgtttt attatttttaaatatgaata attaagtgtt atgaatagtt 3600 ttttttttaa tgggatttat attttgagaattattgatta gaggttaagg gttttgtgtt 3660 tattatttgg tatatattaa tgataggtttttgagtttga attttggtta attatattgt 3720 tagttttggt tttttttttt ttttttttttgagatagggt tttgtttagg ttggagtgta 3780 gtgatgtaat tacggtttat tgtagtttcgattttttggg ttaagttatt ttgtcgtttt 3840 agtttttcga gtagttgggg ttataggtgtaagtcgttat gtttagttaa tttttaattt 3900 ttttgtagag gtggggtttt attatattgtttaggttggt tttgggtttt tgggtttatt 3960 tatttcggtt ttagttttgt tttttgattaaattatttat ttttttgtgt ttgatttatt 4020 ttatttgtga aatttagata gtaagttagtgtatggtaag tgtaaaaagt aatatttggt 4080 ataatgttta ataaatgttg gttaaattttataattattt tttgtaggaa gtgggacgat 4140 aaagttaagg gtttaggtgg ttagagaagagtaaggatta tgtttttttt ttgtgtagtt 4200 aggtaggttt tgtatttttt ttttgcgcgatttttttcgg gtagtatcgg gtttcgaatt 4260 tttacgtttt atttttaagt aggttttgtagtttagtttt cgcggttttt tatagttagt 4320 cgatgttgcg taagcgtcgt atttacgttttagtatatgc gtatttaggt gcgtcggtag 4380 gggacgcgtc ggtatagtaa aaatggcggcggtattacgg gtggcggcgg tcggggtaag 4440 gtttagcgtt ttggcgagcg gttttcgcgtcgcggttcgt agtttttgta gttaggttat 4500 ttttgttaac gaacgtatcg aaaataagcgtcggatcgcg ttgttgggag ggggttaacg 4560 tcgtattgac gcgtagtata agcgagtgagttttgagggg tttaagtgag tttcgttttt 4620 ggcgttcgcg atttattatt gcgtgttcggtttgcggcgt tcgaggtttt tttgttaatt 4680 cgtacggtgt ttggaggggt cggagtaagggtgtttattt tgaaaatttg tagcgttttt 4740 cgtggaggcg ggtataatta gtagaagtatttgtgtgttt ttttatattg tttaattttt 4800 gggatttaga cggatttggt tcgtttttagttagtttaat atttaatata agtttttggg 4860 taatttatta aatttttgtg ggttattttaataataattt tttttttata agtgtatcgt 4920 tagattatag atagtaaaat gataggcgtttagtaaaaat tatgtgttta ttttcgtgtt 4980 ttatgaaaga gtgatggtag gtttttttttttttgtggaa gtaggaaaat tgaatttggg 5040 tatattttat taatatgaaa tgggggatgtgcgcgtgtag gaatttgtgg aatttttgtt 5100 cgtagaatgt ttggtcgagt tttttagggttttagtatgt ttcgttttga tgggtagtaa 5160 aggtacgtgt cggaagtagg tggtttttttgggagtgcgt aggttatttt cgatgtttgg 5220 ttggattgag tagttgaaat attgttatttatcgtttggg ttttgaggcg agaatttagt 5280 tggtttttag agataagttg ggcggtttattttggagagg tgatttttga tttgaaatta 5340 ggtttgttta gtgtgttcgt gattggtgggtgagtttgga tcgttgtgtt gaacgaatta 5400 attaacggga aggtgtagaa gtgaaatttttatagatgaa gagtatttag gtataattta 5460 taattatgag ggaggtattg ggggagggatggggttttaa agtgaggaga tttgaatagt 5520 tttatatttg tttaatattg atttagatgttataaattcg tatttgataa gggtttaaag 5580 gtaata 5586 52 5586 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 52 tgttatttttggatttttgt taaatgcgaa tttatgatat ttgaattaat attagataaa 60 tatagagttgtttaaatttt tttattttaa gattttattt tttttttagt gtttttttta 120 tggttgtgagttgtgtttga atatttttta tttgtaagag ttttattttt gtattttttc 180 gttggttaattcgtttagta taacggttta gatttattta ttagttacgg atatattggg 240 taagtttggttttaagttag ggattatttt tttaaaatgg gtcgtttagt ttatttttga 300 aggttagttggattttcgtt ttaaaattta ggcggtgggt ggtagtgttt taattgttta 360 gtttagttaaatatcgagag tagtttgcgt atttttagaa aggttatttg ttttcgatac 420 gtgtttttgttatttattaa ggcgaggtat gttaaggttt taaagagttc gattaggtat 480 tttgcgggtagaagttttat aagtttttgt acgcgtatat tttttatttt atgttagtgg 540 agtatgtttaagtttagttt ttttgttttt ataaaggaga aagaatttat tattattttt 600 ttatggggtacgagaataag tatatggttt ttattgagcg tttattattt tgttatttat 660 ggtttaacgatatatttgtg aaggaagaat tattattaaa atgatttata gagatttaat 720 aagttgtttaaaagtttatg ttaagtgttg agttggttag agacgagtta gattcgttta 780 aattttaagggttaaatagt atgaaaaagt atataggtgt ttttgttggt tatattcgtt 840 tttacgagaaacgttatagg tttttaaggt gaatattttt gtttcggttt ttttaggtat 900 cgtgcggattggtagggagg tttcggacgt cgtaagtcgg gtacgtagtg ataggtcgcg 960 gacgttaggggcgggattta tttaggtttt ttaggattta ttcgtttgtg ttgcgcgtta 1020 atacggcgttggtttttttt tagtagcgcg gttcggcgtt tgttttcgat gcgttcgtta 1080 atagaggtggtttggttgta aaggttgcgg atcgcggcgc ggagatcgtt cgttagaacg 1140 ttgagttttgtttcgatcgt cgttattcgt aatgtcgtcg ttatttttgt tgtgtcggcg 1200 cgttttttatcggcgtattt gagtacgtat gtgttaaagc gtgggtacgg cgtttgcgta 1260 gtatcggttggttgtaggga gtcgcggggg ttggattata gaatttgttt gggagtaagg 1320 cgtgagagttcgagattcgg tgttgttcga ggagggtcgc gtagagaaaa agtatagggt 1380 ttgtttggttgtataaaaaa gggatatagt ttttgttttt ttttgattat ttagattttt 1440 aattttgtcgttttattttt tatagaaaat gattataaga tttaattaat atttattaag 1500 tattgtgttaggtgttgttt tttgtattta ttatgtatta gtttattatt tggattttat 1560 agatgaggtaaattaagtat agagagatga gtgatttgat taagaggtaa gattgaggtc 1620 gaggtaggtgagtttaggag tttaagatta gtttgagtaa tatagtaaga ttttattttt 1680 ataaaaaaattaaaaattag ttgggtatgg cggtttgtat ttgtgatttt agttattcgg 1740 gaggttaaggcggtaggatg gtttggttta ggaagtcgag gttgtagtga gtcgtgattg 1800 tattattgtattttagtttg ggtaaaattt tgttttaaaa aaaaaaaaaa aaaaaagtta 1860 agattgataatgtggttggt taggatttaa atttagagat ttattattaa tatgtgttag 1920 ataatgagtataggattttt aatttttaat tagtagtttt taaagtatgg attttattaa 1980 agaaaaaattatttatgata tttaattatt tatgtttaag aatggtaagg taaattttat 2040 ttaggtttaatttgatagag gtagggatag agttttgtta taagttagag cgattgggtt 2100 gaatatagtaaagtggtaat ttatagttaa ggggtagtgt gtggaagtta gtggatggaa 2160 aattattaagaggaaatatt ggcggggaat ttggttaaat tgatttaata ggatttttgt 2220 ttaaggtaggttagggtaat tgaatattat ttgggggatg gtggcggtat gggttaaaat 2280 tagatatggagagtaattag atattaagaa tggaggattt tggttaaatt gatttggtaa 2340 gttttttgttaaaatggaat tttataagga atgatatggg agtttatatt taggtttagt 2400 taaagagagagtttagaaga gtttgattaa tgtttgatta aggagggaat tttgttaatt 2460 tagtaattttagtattattt gggagtgagt tggaaatgta agttcgaatt tttagaattt 2520 attttagatttttaaattag aaattttggg gttggggtta gttatttgtt ttagtagatg 2580 atttttaggtgattttgatt tgtttgttaa agtttaagaa ttattgtttt aggaatttgg 2640 aattgtattgttgagagttt gattatttgt tttttttatt aataggtagg tttttaagat 2700 aaagaatatggtttatattt tttattttta gttatagaaa attgttaaag ttgattatga 2760 gttttttttagatttagttt atagttaggg tttttataaa gtataaattt tgatttatga 2820 ttttaatgttaatgtaattt aatttagaaa atatttttga gtatttatta tgtgttaaga 2880 attaaatattagtattgatt gtattttttg gagtagtaat agtttattta gatagagagg 2940 gtagtttagaggttaaagtt ttttggttag gtaaagttta tttgtatttg tataatttcg 3000 taatgggtatttttgatttt gtatttgggt ttttgtttta aagattttat taatttagag 3060 aggtagatggataatttaga gaggtagatt gttttgggag tataagagag aatttgagta 3120 aggttgagtgtgttgaggag agttttttta agaaagtatt tatatgttag ggaatagaag 3180 tagtgtgagtaaaggtttgg tatgtttaga tttatatata tagatatata tatatatttt 3240 gttgtgtttttagtttttgg ggaaatggtg gtaaatgaga ttggaaagtg agaatggtat 3300 tagattgtgaagagtttttt tatgtttaga aattgggatt tgtttttggt ttgggggtag 3360 ttggatttttttgttttata gtgttttgta ggttttttat ataaagtata ttttatattg 3420 tgttaagattgtttagttgt ttttttagat agatttttta gttaaaggtt agggattgta 3480 gttgatttgtttattattgt ggttttagta tttggaataa ggtttaacgt agagaaggtt 3540 tttagaatgtatttgtgaaa ttgaatcgag ttagtaaata ggtaattgta tgtgagttta 3600 gaggttttcgtttttttttt tatgtttttt taggttttga aatttgttta ggtattattt 3660 tttttatgtagtttattttg atttttagaa gtaaggaagt tttttttatt taattttaga 3720 taattagtgtttagtagaaa atttaatata gggaggttta ttgaatttaa ttgttttttt 3780 tagttagttttttttttttt tatttttttt ttattgtttt aatgttttgt ttatgggtat 3840 tttatagttttatagatttg taatgttatt ttttagattt tatatgtaag ttttagtttg 3900 gggtaggtgggtgggggtag gaggaagttg gaggtaggag gtaattattt agtaattgtt 3960 ttttaatattattatgtttt aggttgtttt tttgttttta gttttttcgt tggtggttgc 4020 gttcgagtttttttttttat tgtgagatag gagttatttt gattttttag tttttttatt 4080 ttttgagacgtagagttgaa atttggagtt aatatttggg tataaatttt gtttttgttt 4140 tgattttttggataatatag ggttatttat ttaaggattt tagttttttt tgtaaaagtg 4200 gagagggggtgatttgtgaa atttttgtgt tttgagtttg ttatttatga tataataata 4260 agagtttagttattggtgtt agattgtttt gaggttagtt ttaattttgt tagttatttt 4320 tgtgtgatttggataatttg gttttagttt ttttttttgt aaaattggaa taataatagt 4380 tttattttagagttgtaagg tttattttta tttatttatt tatttatttt tgagataggg 4440 ttttgttttgttatttaggt tggagcggat tggtaggatt atagtttatt gtagttttga 4500 atttttgggtttaggtgatt ttttttattt agttttttga gtagttggga ttataggtat 4560 atgttattatattagttaga tttttaagat ttttgttttg tattaattat gttttttttt 4620 tttggtgtgtgtggtgtgta tgtgtgtgtg tgttttaatt gaataaaaaa tgaagtgttt 4680 aaaatttacgtttattttta tttttttttt ttttgagata gggttttgtt ttgtttttta 4740 ggttagagtgtagtattgtg attatggttt attatagttt tgattttttg ggtttaagta 4800 attttttatttaagtttttt ttatagttgg gatcgtaggt agatgttatt aagtttggtt 4860 aatttttttttttttttttt tttaagatag agtttttttt tgttatttag gttgtaatgt 4920 tagagtgtatattttggttt attgtaattt ttgttttttg ggtttaagag atttttttgt 4980 tttagttttttaagtagtta ggattatagg tatgtgttat tgtgtttaat ttttttgtat 5040 tgttagtagagacggggttt tatcgtgttg gttaggttgg ttttgaattt ttgattttaa 5100 gagattttttcgttttggtt ttttgaagtg ttgagattat aggtgtgagt cgttatattt 5160 ggttttaattttttaatttt gtgtagagat aatggttttt ttatgttgtt taggttgaaa 5220 atttatattgttagtgttga attgtgtttg ttttgatgtc gagattagaa tttaagagtt 5280 ttagtttaaattgtatttaa agatttttat taagatttgg agtttaggtt atgcgtagtg 5340 gtttatatttgtaattttag tatttgggga ggttaaaata ggaggattgt ttgaggttaa 5400 gagtttgagattagtttggg taatatggta agatattatt tttataaaaa attaaaatgt 5460 tagttaggtatggtggtgta tatttgtagt tttagttatt ttagaggttt ggggaggagg 5520 attttttgagtttaggagtt tgaggattgt agtgagttat atgaaaaaaa gttttttagt 5580 ttgggt 558653 5244 DNA Artificial Sequence chemically treated genomic DNA (Homosapiens) 53 ttttgatttt agatgatcga ttcgtttcgg ttttttaaat tgttgggattataggtataa 60 gttattgagt tcggttaggt atgagttttt gtagggtata ttagattgaaaatgaagatt 120 gttaggttag gcgtggtggt ttacgtttgt aattttagta ttttgggaggtaaggtgggt 180 ggattacgag gttaggagat cgagattatt ttggttaata cggtgaaatttcgtttttat 240 taaaaatata aaaatttagt cgggcgtggt ggcgggggtt tgtagttttagttgtttagg 300 aggttgaggt aggagaatgg tgagaattta agaggtaaag tttgtagtgagttaagattt 360 tattattgtt ttttagtttg ggtgatagag cgagattttg ttttaaaaaaaataaaaaga 420 aaaagaaaag attgtgggtt gggcgcggtg gtttatattt gtaattttagtattttgggg 480 ggtcgaggta gtcggattat ttgaggttag gaatttgaga ttagtttggttaataaggtg 540 aaatttcgtt tttattaaaa atacgaaaat tagtcgtatg tggtagtaggcgtttgtaat 600 tttagttatt cgggagtttg aggtaggaga attatttgaa ttcgggaggcggatgttgta 660 gtgagttaag attaaatttt tgtatttttt gtattttggt ttgaggataatagtaagatt 720 tgattttaaa aaaaaaaaaa aagattttgg attgggtgta gtggtttatattagtaattt 780 tagtattttt cgaggtcgag gcggacggat tacgagatta ggagttggagattagtttgg 840 ttagtatggt gaaatatcgt ttttattaaa aattagtcgg gtatggtggtgcgtattcgt 900 agttttagtt attcgggagg ttgaggtagg ataattgttt gaattcgtgaggtagaggtt 960 gtagtgagcg gagttcgtat tattgtattt tagcgtgcgc gatagagattttgttttaaa 1020 aaaaaaaaaa aaaagaaata aaagaaagat ttaatattat attaggatatgtaattttta 1080 tttatttttt atttttaata aggaagaaag gttttttttt taattttgtttttttaatat 1140 ttgaggatag gtatttttaa tttttttttt tttagggagg ttttagtattagtgtttgtg 1200 gacgtagttt ttgaagagtg ttttagttga tggggaagga gaaatttaagatagagattt 1260 ttttagggat ggcgttattt ttttgttaat tttttcgttg tttttttttgaaagtagaag 1320 aagtgttagt ttttagtttt cgttagattt tgggttttta gggttttgtataagtttatg 1380 gttttttggt tttagtttag gacggttagg cggaattggg agtagtttttatttaaggtt 1440 atttgtggga gaagataata ttaatttttt tggggttaaa aaagaaaaaggtttttttat 1500 tttttttttt aattcgggtt ttttttttat atatttttgt ttttttaggtttttatttgt 1560 cgttttattt atttttttat tttagttatt tttttgatta ttttggaattaattttttga 1620 tttgttgtgg agagaaagag gtaaaaaata gttattgttt gagttgaaggggattagaaa 1680 atgatatcgg ttgggttttg gggatagggg ataatagtgg ggtttgtggggtgttttgtt 1740 tttattttag ttttagtttt tgtttagtat ttcgatattt cggtattatatagatatttt 1800 ttagataaat ggtgcgtttt ttttatgtat tgtagatgaa atagtatattttatagttta 1860 ttacgtaggg ttttgagaga gagaaaaggg gagtaaggtt tttggaagtttgtggggaga 1920 tttttgaggt cggttggaga ggtggatttt taagggttag gtgtttttatttagtagttt 1980 ttcgggcgtt ggaagaattt ttgttattaa atagtgatag aaaggattgtttttaaagtt 2040 atttgttttt agggttgtcg agattggagt tgtgataaag agatagagaaagaggacgtg 2100 ggtgtatgtt tagtttggag ttgtcgtttg gggaatttat tttttattttttttttagtt 2160 ttcgttagaa tttgggcgtt gagtttttat tttttttatt gatttttatttgattcgaga 2220 gtttttcgaa ttcggttagt ttttaaggcg tgggtacgga agttagattagagtagaagg 2280 gtttcgttgt ttttcgagta ggtttttaag gcgagttttt ttttttgttttcgtttttta 2340 cgatttcgtt ttggtcgcgt tattttgatt ttcgggttat cggtttgtagtttttattcg 2400 aattagtttt aggatatttt tatagttttt ttttttggtt tttcggattcgtacggaagt 2460 tattcggatt ttcgttgttt gggattaaag ttttagggtt tcgtaaacggtaattagatt 2520 ttttaaaggg tttacggatt tggattttga agagtttgag agagcggggtggcgggagtc 2580 gggggggacg gcggggtagt cgcggtttgg taagtggagt tgggatttcggcgtcgtacg 2640 ggaggagaga gtaggttagc gaggcgattt tttgttcggg tatagttttattttttcgaa 2700 ttttgtcgta gtagggggta taattgttag ttaattagtt tggagaataggtacggtcgc 2760 gtttttttta agttttattt tcgatagttg gattttgtga ttgggtttttgggtagagtt 2820 taaggttgga gtgaagcggt ttttttgcgg ttgtgtgggt gttttaatttgggtcgagat 2880 atttcgcggt ttaaaggttt tttcgtagtg ttttttaaat tgatatatgtagtgataatt 2940 tgttttagtt ttaggtttat ttattcgttt agattttggg taagttttaagatttttagt 3000 tttgaaagtt gttttttgta gtttttgagt agtatgaagt gttattttttgggggtattt 3060 gtatttttta aatgttttat ttttatattt atttatttat ttatttttggagatggtgta 3120 ttgttttgtc gtttaggttg gggtgtagtg gcgcgatttt tgtttattgtagtttttatt 3180 tttcgagttt aagcgatttt tttgttttag ttttcggagt agttggaattatagtcgcgt 3240 atcggtacgt tcggttaatt tttttttttt tttttttttt tttttttttgttttaacgga 3300 tttttatttt gttatttagg ttggagtgta gtggcgcgat ttcggtttattgtaattttt 3360 tttttttggg tttaagcgat ttttttgttt tattttcgga gtagttgggattataggtat 3420 gggtaattat atttggttaa tttttgtatt tttagtagag acggggttttattatgttgg 3480 ttaggttggt ttggaatttt tgattttaag tgatttgttc gttttagttttttaaagtgt 3540 tgggattata gatgtgattt attaagttcg gtttgttatt tgtattttaaaatgggttat 3600 ggggtgggta tagtggttta tatttgtaat tttagtattt tgggaggtagaggtaggcgg 3660 attatttgag attaggaatt tgagattagt ttgattaata tggtgaaatttcgtttttat 3720 taaaaatata aaaattagat aggtgtggtg gcgtatgttt ttatttttagttattcggga 3780 ggttgagata ggagaatcgt ttgaatttgg gaggtggagg ttatagtgagtcgagatcgt 3840 gttattgtat tttagtttgg gtaataaaag cgaaatttta ttttaaaataaataaataaa 3900 ataaaatgcg ttagggaggg tcgggttttg tggttaatgt ttgtaatttaggtattttgg 3960 gaggttgagg tgggcggatt attttaggtt agaggttcga gattagtttgggtaacgtgg 4020 tgaaattttc gtttttatta aaaatataaa aaaatttgtt gggcgtggtggtgcgtgtat 4080 ttgtagtttt aattattaag gaggttgaga taggaggatc gtttgaattcgagaggtaga 4140 ggtagtagtg agtcgagatt acgttattgt attttagttt gggtgatagagtaagatttt 4200 gtttaaaata aaataaaata aaataaaata aaataaaata aaatgggttagggagtgggt 4260 gatttttatt gttagattgt ttaggttttg taataaatgg ataagggaagataattgaga 4320 ggcggggggt aggttttttt ttaatattta ttgaattata tatatagataatattttttt 4380 gggagatagg ttttagaggt ttgggaaaag attgggggag gagtttagattagatgttag 4440 gtattgtgtt tgtatttttt taatgaattt ttttttatag ttatttcgtaaagtattatt 4500 ttttttattt tatagataag gatattgaag tatagaggtg aagtgatttgtttaaggtta 4560 tttagttaga aatttaggat tttattattt tatttttagt tttgatataggatgttattt 4620 gggacgtagg ggaggattgt ttttagattt taggtttgtg aatgtaggtttttcgagtgg 4680 atagaaattt tggaggattt agattaggtt ttagaggagg agaggggagatggaatattt 4740 ttttttagtt tagaaatttt ttcggtagtg gaggatgata gtggaggggattttgttttt 4800 tattttattg atttttagag gggtgatagt tgagttttgt gattgggtttttgggtaggg 4860 gttaagggtt agtgtttttg ttttttttat tttttttttt tcgggtaatttttaattttt 4920 tatcgtttat acgtaaggtt gtttgttttt atatattttt ttaagagttgtttgagtcgt 4980 cgagtggata gtggttgatt atggagagta gaggtttatt ggttatttcgcgtttgttgt 5040 tgttgttgtt gttgttatta ttgcgttata ttcgttaggg atgggttttgagatttgttt 5100 tttttattta ggtgtaggag cgggataggg tatttagttt atgtagtttttttttttttt 5160 ttttggtttt gtagtagggt tttttttttt gtttgttttt gatatgtttttatttagttt 5220 tgtttgtttt ttttttttga taga 5244 54 5244 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 54 tttattagaaagagaaaata aataaagttg agtagggata tgttagagat agatagaggg 60 agaggttttgttatagggtt agaggagaga agggaagatt gtatgagttg agtgttttgt 120 ttcgtttttgtatttgggtg gggagaatag gttttagggt ttatttttgg cgggtgtgac 180 gtagtagtagtaatagtagt aatagtagta ggcgcgaggt agttagtggg tttttgtttt 240 ttataattagttattgttta ttcggcggtt tagataattt ttgggagaat gtgtagaggt 300 aggtagttttgcgtgtgggc ggtggagggt taaaggttgt tcggggagga gggggtaaag 360 gaaataggggtattgatttt tgatttttgt ttaggggttt agttataaga tttagttatt 420 atttttttggggattaatgg ggtgaaggat agagtttttt ttattattat tttttattgt 480 cgagaaagtttttgaattgg gagaggatat tttatttttt tttttttttt ttagggtttg 540 atttaggttttttaagattt ttgtttattc ggggagtttg tatttatagg tttgaggttt 600 agaaatagtttttttttgcg ttttaagtag tattttgtat taggattaga aatgagataa 660 tggaattttaaatttttagt tgagtgattt tgggtaagtt attttatttt tgtgttttag 720 tgtttttgtttgtaaaatga ggaaaataat attttacggg gtgattgtga aagagggttt 780 attgagaaaatgtaggtata gtgtttggta tttggtttga attttttttt tagttttttt 840 ttaggtttttgaggtttgtt ttttaagaag gtattgtttg tgtgtatgat ttagtgaata 900 ttaagaagggatttgttttt cgttttttag ttattttttt ttatttattt attatagggt 960 ttaaatagtttagtagtaga aattatttat tttttgattt attttatttt attttatttt 1020 attttattttattttatttt agatagagtt ttgttttatt atttaggttg gagtgtagtg 1080 gcgtgatttcggtttattgt tgtttttgtt tttcgagttt aagcgatttt tttgttttag 1140 tttttttagtagttgggatt ataggtgtac gtattattac gtttagtaaa tttttttgtg 1200 tttttagtagagacggggat tttattacgt tgtttaggtt gatttcgaat ttttgatttg 1260 aaatgattcgtttattttag ttttttaaag tatttggatt ataggtatta gttataaggt 1320 tcgattttttttgacgtatt ttattttatt tatttatttt gagatggagt ttcgtttttg 1380 ttgtttaggttggagtgtaa tggtacgatt tcggtttatt gtaattttta ttttttaggt 1440 ttaagcgatttttttgtttt agtttttcga gtagttggga gtaaaggtat gcgttattat 1500 atttgtttaatttttgtatt tttagtagag acggggtttt attatgttgg ttaggttggt 1560 tttaaatttttgattttagg tgattcgttt gtttttgttt tttaaaatgt tgggattata 1620 ggtgtgagttattgtgttta ttttatgatt tattttaaaa tgtaaatgat agatcgggtt 1680 tggtgggttatatttgtaat tttagtattt tagaaggttg aggcgggtag attatttgag 1740 gttaggagttttagattagt ttggttaata tagtgaaatt tcgtttttat taaaaatata 1800 aaaattagttaggtatggtt gtttatgttt gtaattttag ttatttcgag ggtgaggtag 1860 gagaatcgtttgaatttagg agggagaggt tgtagtgagt cgagatcgcg ttattgtatt 1920 ttagtttgagtgatagagtg agaattcgtt aaaataaaaa aaaagagaag aaaaaagaaa 1980 aaaaaattagtcgggcgtgt cggtgcgcga ttgtagtttt agttatttcg gaggttgaga 2040 taggaggatcgtttgaattc gggaggtgga ggttgtagtg agtagagatc gcgttattat 2100 attttagtttgggcgataaa gtaatatatt atttttaaaa ataaataaat aaataaatat 2160 aaaaataaaatatttaaaaa atgtaaatgt ttttaagagg taatatttta tgttatttaa 2220 gagttgtaggaaatagtttt tagagttgag ggttttaagg tttatttagg gtttgggcgg 2280 gtgagtgagtttgaggttaa agtaggttat tattgtatat gttaatttaa aaagtattgc 2340 gggggagtttttgaatcgcg gggtatttcg atttaggttg ggatatttat ataatcgtaa 2400 ggaagtcgttttattttaat tttgaatttt atttaggagt ttagttataa gatttagttg 2460 tcgggggtggggtttggggg ggacgcggtc gtgtttgttt tttaagttga ttggttgata 2520 gttgtgttttttgttgcgat agaattcgag ggggtggggt tatgttcgga tagaggatcg 2580 tttcgttggtttattttttt ttttcgtacg gcgtcggaat tttagtttta tttattaggt 2640 cgcggttatttcgtcgtttt tttcgatttt cgttatttcg tttttttagg ttttttagga 2700 tttaagttcgtaggtttttt aaggggttta gttgtcgttt gcgaggtttt gggattttgg 2760 ttttagatagcggggattcg gatggttttc gtgcggattc gagaggttaa ggagggagat 2820 tgtggagatattttgaggtt gattcgggtg aagattgtag gtcggtaatt cgggggttag 2880 agtggcgcggttagagcggg gtcgtaggag gcgggggtag ggggaggggt tcgttttggg 2940 aatttgttcggggagtagcg gggttttttt gttttaattt agttttcgta tttacgtttt 3000 aggagttagtcgaattcgaa aaattttcgg attaggtgaa gattagtgaa gaaggtgggg 3060 gtttagcgtttaggttttgg cggaggttgg ggaggaaatg agggatgggt tttttaggcg 3120 atagttttaggttgggtata tatttacgtt tttttttttt atttttttgt tataatttta 3180 atttcggtagttttgagagt agatggtttt ggagataatt ttttttatta ttgtttggta 3240 gtagagatttttttagcgtt cgggaagtta ttgggtaaga gtatttggtt tttagaagtt 3300 tatttttttagtcggtttta gaggtttttt tataggtttt tagaagtttt attttttttt 3360 ttttttttttagggttttgc gtggtgggtt atgggatata ttattttatt tatagtatat 3420 ggaagggacgtattatttat ttggaggata tttatgtgat gtcggaatat cggggtattg 3480 ggtagaagttgaggttgggg tgggagtaaa gtattttata gattttattg ttattttttg 3540 tttttagagtttagtcggtg ttattttttg atttttttta gtttaaataa tagttatttt 3600 ttgtttttttttttttataa taggttaagg gattggtttt aaaataatta aaaaggtggt 3660 tgaggtgaggagatgggtgg ggcgataagt gaggatttga agaagtaagg gtatatggag 3720 gggggattcgggttgaaaga gggagtgaga aaattttttt tttttttgat tttagaaaag 3780 ttagtgttgtttttttttat aggtggtttt ggataagggt tgtttttaat ttcgtttggt 3840 cgttttggattggaattaga gggttatgga tttgtataag gttttaggag tttaagattt 3900 gacggaagttgagggttggt attttttttg tttttaagga gaggtaacga gaaagttggt 3960 aggaaagtgacgttattttt aggaggattt ttgttttgag tttttttttt tttattagtt 4020 gaagtattttttagagatta cgtttataga tattgatgtt gaggtttttt tggaggaagg 4080 agggttaggggtgtttattt ttaagtattg gaagagtaga attgagggag agattttttt 4140 tttttgttgagggtgaaaaa taaataagaa ttatatgttt tgatgtggtg ttgggttttt 4200 tttttatttttttttttttt tttttttgag atagagtttt tgtcgcgtac gttggagtgt 4260 agtggtgcgaatttcgttta ttgtaatttt tgttttacgg gtttaagtaa ttattttgtt 4320 ttagtttttcgagtagttgg gattacgggt gcgtattatt atgttcggtt aatttttagt 4380 agagacggtgttttattata ttggttaggt tggtttttaa tttttgattt cgtgattcgt 4440 tcgtttcggtttcgaaaagt gttgggatta ttggtgtgag ttattgtatt tagtttaaag 4500 tttttttttttttttttgag attaagtttt gttgttgttt ttaggttaga gtgtaaggag 4560 tgtaaaggtttgattttggt ttattgtaat attcgttttt cgggtttaag tgattttttt 4620 gttttagattttcgagtagt tgggattata ggcgtttgtt attatatgcg gttaattttc 4680 gtatttttagtagagacggg gttttatttt gttggttagg ttggttttaa atttttgatt 4740 ttaggtagttcgattgtttc ggttttttaa agtgttggga ttataggtgt gagttatcgc 4800 gtttagtttatagttttttt tttttttttt tatttttttt gagatagagt ttcgttttgt 4860 tatttaggttggagggtagt ggtgagattt tggtttattg taagttttgt tttttgggtt 4920 tttattatttttttgtttta gttttttgaa tagttgggat tataggtttt cgttattacg 4980 ttcggttaagtttttgtatt tttagtagag acggggtttt atcgtgttag ttaggatggt 5040 ttcgattttttgatttcgtg atttatttat tttgtttttt aaagtgttga gattataggc 5100 gtgagttattacgtttggtt tgatagtttt tatttttaat ttggtatgtt ttataaaagt 5160 ttatgtttggtcgggtttag tggtttatgt ttgtgatttt agtagtttgg gaggtcgagg 5220 cgggtcgattatttgaggtt agga 5244 55 815 DNA Artificial Sequence chemically treatedgenomic DNA (Homo sapiens) 55 gagttttagg attgagatat ttttattatattttttttat tattttgtat ttttaaaata 60 gtttttaggg tatttttatt tgtttttgtggaaagattgg taattagagg tagaaaagtg 120 aaataaatgg aaatagtatt atttagggttgttatattta tatttgtgtt tttgtagtgt 180 taatttgtat tttttgagtg agttatttttatttattttt atagtagtta gtatcgtagt 240 gttttgtata tattatattt ttaatgagtatttgttaatt gattttgtat atgcgtgtga 300 tagtataaat atattatgaa aaatgaggaggttaggtaat aaaagagtta ggattttttt 360 taaaaaaaat atatagcggt ggagtttggtataaagttta aatgttttta tattttgttt 420 tgtagtattt ttaattaggg gattttgataaggaagttga agggtgatat tatttttgtt 480 tttttattgt aattgaatat attttttagtttttaggtgg ttttcgttgg ttaatttgtt 540 gtggagtttt taagggtata gaatcgttttttatataatt aaaagaagat gttgtttaat 600 ttgaggattt tgttaaataa tgtagtttttagaaatggtt ataattttat ggttcgaaat 660 tttcggtaag tgatggttag agatttgggtttgatttagg aattatggtg atgtataaaa 720 ttatattttg tagtaaggtt tttttttgtagaatgtagtg ttacgttttg ttttattttt 780 atttgagata gttgttttta attttagtaaagttt 815 56 815 DNA Artificial Sequence chemically treated genomic DNA(Homo sapiens) 56 aagttttgtt ggaattagag gtagttgttt taaataagag taaagtagagcgtggtatta 60 tattttgtag aaagaggttt tattgtagaa tatagtttta tgtattattatgatttttaa 120 attaaattta agtttttgat tattatttat cgaaaatttc gaattatgaagttgtgatta 180 tttttaaaag ttgtattgtt taataggatt tttagattaa atagtatttttttttaattg 240 tgtaaaggac gattttatgt ttttgaaaat tttatagtaa gttagttagcgggggttatt 300 taaaaattaa gaaatgtgtt tagttgtagt gagggagtaa aggtaatattattttttagt 360 ttttttatta aagttttttg gttagagata ttgtagggta gggtgtaggagtatttgaat 420 tttatgttaa gttttatcgt tgtgtatttt ttttggaaga aattttgatttttttattgt 480 ttggtttttt tattttttat aatatattta tattgttata cgtatgtataaaattaattg 540 ataagtattt attgaggata taatatatgt aaggtattgc ggtattggttgttgtgaagg 600 tgagtagaag taatttattt agaaaatgta aattggtatt gtaaaaatatagatgtagat 660 gtgatagttt tgagtagtat tatttttatt tattttattt ttttatttttaattgttagt 720 ttttttataa aaataaatag aagtgttttg gaagttattt tgggggtgtaagatgataga 780 gaaggtatag taaaaatatt ttagttttgg ggttt 815 57 762 DNAArtificial Sequence chemically treated genomic DNA (Homo sapiens) 57gagttttatt ttttgttaaa ttagattatt taattagaaa tagtattaga ttttatagta 60tgttaaattt aattgtgaat tgtatatgta agggatttag gttgtatgtt tttaatgaaa 120atttaattag tggaaaaatt gttttttacg aaatcggatt ttggtgataa aaaggttggg 180gatttcgatt tatggtattt gtggagaatt ttatggttag tatatttggt aaataaattt 240aaaagaaaac gaattttatt ttattaaaaa tgaatatatt tatatgtata aatataagtt 300ggaatgggga aatttatgta gttggaaaat agttattaaa tgtaaataaa tataattata 360gtgtagatta aggattagta atttttttag aggtaataat aatattaatg ttgtatattt 420attttttttt tttttttttt ttttttttga gacggagttt ggttttgtcg tttaggttgg 480agtgtagtgg ttcgatttcg gtttattgta acgttcgttt tttaagttta tgttattttt 540ttggtttagt ttttcgagta gttgggatta taggtattcg ttattacgtt tggcgaattt 600tttgtatttt tagtagagac ggggttttat cgtgttagtt aggatggttt ggattttttg 660atttcgtgat ttatttattt cggtttttta aagtgttggg attatagata tgagttatcg 720cgtttagttt tatttatttt tttttaaaag ttagatttta gg 762 58 762 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 58 tttagggtttgatttttgaa aagggatgaa tagggttggg cgcggtggtt tatgtttgta 60 attttagtattttaggaggt cgaggtgggt ggattacgag gttaggagat ttagattatt 120 ttggttaatacggtgaaatt tcgtttttat taaaaatata aaaaattcgt taggcgtggt 180 ggcgggtgtttgtagtttta gttattcgag aggttgagtt aggagaatgg tatgaatttg 240 ggaggcggacgttgtagtga gtcgagatcg ggttattgta ttttagtttg ggcgatagag 300 ttaggtttcgttttaaaaaa aaaaaaaaag aaagaaaagg atgaatgtat aatattggtg 360 ttattattatttttgaaaag attgttagtt tttaatttat attataatta tgtttgttta 420 tatttaatagttatttttta attatataaa tttttttatt ttaatttatg tttgtgtatg 480 taaatatgtttatttttaat gagataagat tcgttttttt ttgaatttgt ttattaagtg 540 tgttagttataaaatttttt ataaatgtta tagatcgggg tttttagttt ttttgttatt 600 agggttcggtttcgtggaag atagtttttt tattagttag atttttatta ggagtatgta 660 atttagattttttgtatgta tagtttataa ttgggtttgg tatattgtag aatttaatgt 720 tgtttttgattggataattt gatttgatag gaggtggagt tt 762 59 645 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 59 ttgtagtttt tgttaggttttgttagtcgg ggcgagggtt gggatgattt tggcggttta 60 tgtttgtgtg ggttgtttttttcgttgtga attttgtatt tgtttcgtaa gtttttattt 120 aggtagattt tttgggtataaagggtgttt gtttagtagt cgggtatgag ttgtttcgat 180 gggcgaagga ggttgtttattttatagttg gagagggttt tttttgttta gtgggcgatt 240 tgggttacgg ttaagttgttattagttagt ttcgtttgaa aattattttt ggtttcgtgg 300 gggatttaag cggtttaagcgagggttttt ttgagcgtcg gagtttatag gtttcgtttt 360 gtttcgaaag ttttcgtaatcgaggcggag gcgatcgagt tttcgatttt tttagaacgt 420 tgttataaga aggggaacgtcggaatagtg tattatcggg cggcggtcgg ggcggcggta 480 ggagggcggg cggggggtagggtttcgggg gattgggcgg gttatggcgg aggacggcga 540 ggaggcggag ttttatttcgcggcgtttta tataagtggg tagtggtcgg attgcgcgta 600 gatattgatt tttagcgtttcggttcggtt atggcgtttt ttagg 645 60 645 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 60 tttggagggc gttatggtcgagtcgaggcg ttgaaggtta gtgtttgcgc gtagttcggt 60 tattgtttat ttatatagagcgtcgcgaag tggaatttcg ttttttcgtc gtttttcgtt 120 atggttcgtt tagtttttcggagttttgtt tttcgttcgt ttttttgtcg tcgtttcggt 180 cgtcgttcga tgatgtattgtttcgacgtt tttttttttg tggtaacgtt ttaggagagt 240 cgggggttcg gtcgttttcgtttcgattgc gggggttttc gggataaggc gagatttgtg 300 agtttcggcg tttaggggaattttcgtttg gatcgtttga gttttttacg gggttagaag 360 tggtttttaa gcggaattagttggtggtaa tttggtcgta gtttagatcg tttattgggt 420 agagagggtt ttttttaattgtggaataga taattttttt cgtttatcgg agtagtttat 480 gttcgattgt tgagtaggtattttttgtat ttagggagtt tatttgagtg aaaatttgcg 540 ggataaatgt agggtttatagcgggagggg tagtttatat aggtataggt cgttaggatt 600 attttaattt tcgtttcggttggtaaggtt tggtaggaat tgtag 645 61 3586 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 61 tttagaattg ataggaaaaataatatggtt atagtattgg agagagagag aaaggagaga 60 ggagaaagga gagagagagaaaggagagag gagagagata gaggagagag agagaggata 120 gagggggaga gagagagaggagagagatag aggagagaga gagaggatag aggggagaga 180 gagggagagg gagagagagggagagagagg gagagagaga gagagagagg gagagagaga 240 gagaaagaga gagagagggagagagagaga gagagttttt taacgtgaga tattttataa 300 tgaataaatc gtttagttattaaagtgtag ttatttttag gagttgttag aaaatgtatt 360 aggattatta gagaaaagtattagaaagat tttttttttt gatacgttgt ataaaataaa 420 taaattgaaa tttaataatatataaggaat tttgtttggg ttttgaagat aatttttttt 480 tgtatattga gttttttaaatattgtagtt tttttatggt ttttgagaaa taattatttt 540 aaatttataa tttttaatattttttaaatt tttttaataa gagaagtttt atttttgata 600 ttatttttta tttgtaaggttaaattatta ttagttttgt agtttattaa ttgggtttgt 660 ttaggttagg tattattattattaatttta ttgttaatat tttaattata agaattaaat 720 tattaatggt gaatagagttttttatttta atataggttt attttattgg tgggatacga 780 gttaattcga aagaaaagttagttatgtgt tttttagagg atgaaagttt aagataaaga 840 ttaaaagtgt ttgatgttggaggtgggagt ggtattatat aggttttagt taagatatgt 900 gataattatt gtagtagtagttggaaagag aaatttgtga ttttaattag ttagtttttg 960 tagattttgt gaggattagaggaagaatgt ttttggttgt tttgtattgt ttgttgtgga 1020 gtttttagat tttcgttggttattttttta gagtttgtgt tttttttaag aatttgatgg 1080 agaaggaatg ttgtttatcgtggagcgggg ataggagttt ttgtggttag tttttaggta 1140 gaggtttttg ttagaatatttttttgttta atgtattatt tgggttttaa ttttttttta 1200 taggggtgga tgatcgggagtcgtggtttt tcgtttttta taataggatt tgttagtgtt 1260 ttggtaattt tatgggatttaattgtggaa attgtaagtt tggtttttgg ggattaaatt 1320 gtatagagag acgatttttggtgagaagaa atattttcga tttgagtgtt ttagagaagg 1380 ataaattttt tgtttattttattttagtaa agtatattat tagtttagat tatgttattt 1440 ttatagggat ttatggttaaatgaaaaatg gattaatatt tatgtttaac gatattaata 1500 tttatgattt ttttgtttggatgtattatt atgtgttaat ggatgtattg tttgggggat 1560 ttgaaatttg gagagatattgattttgttt atgaagtatt agtttttttg ttttggtata 1620 gatttttttt gttgcggtgggaataagaaa tttagaagtt gataggagat gaaaatttta 1680 ttattttata ttgggattggcgggatgtag aaaagtgtga tatttgtata gatgagtata 1740 tgggaggtta gtattttataaattttaatt tatttagttt agtattattt tttttttttt 1800 ggtaggtaag atatgttagatatacgatgt tagagtaggg aggaatttta ataattattt 1860 ttttaggtag ggtataaattttttatttga atatttattg tagtttttat taaggataga 1920 aatggtgttt tgttaagaatttttaatgta ttttgtattt tttttttata gtatatttta 1980 gatatttgtg taattatttgtttaatgatt tttattaggt ttttaaattg taatgaatag 2040 agtatttgat ttattattgtattttttaga atatagtatg gtgtttttaa aaatggtaat 2100 agtgtattat gtattttgtgaattgaataa atgagtgaat gaatgaatat ttggatgatt 2160 aaaaaaataa atgatatatattaatgtttt tgaaaaataa aattattatt tataatagga 2220 tttatatggt gtataaattaaaaatgtaaa tttttggttt tattttagat taattggtta 2280 gaatttttag gagagagtttcgagaaggta taatttatta aatgtttatg gtgatttttt 2340 taattaggaa tgtttgggaaataattattg gattagattt ttatttttga aagtatgaag 2400 attttgaggt ttaaataggtaaataatgaa gatggttaat atttattgaa tatttagtat 2460 gtgtaaattt cgtggtaagtgtttttgtgt attcgtttat tttatgtttt tattagtttt 2520 tttttatttt agaggttataaaggtattag gtaatttgta taagattata tagttaataa 2580 gtagtaaaaa aaaaattatatttatttttt aatagtttag ttgtatgatt attgtatttt 2640 atttttaagg atgtgattgttgtgatattt ttagttaaag gatttggttt attttgtttt 2700 attttttttt taggttgtattagaagttag tttttttttt tagtttttga aaattttaga 2760 taaaatatga agtattattatttggaattg aatttttatt ttatttattt gaatttttta 2820 ttttgaatta ggggtaaatggtaattaaag aaatatgtgt ttaattattt attattttaa 2880 aattatatgt taaaggaatgtttttttgtt tgttttttaa aaatttttaa tatagtattt 2940 ttgattagta atgttttatgaaattaagtt taatatgtga atgggatggg aagaattttg 3000 tatttaattt tttataatttgtagttttga aatgtagatg gtttttttcg tttaattaag 3060 tttgtatttt attttaatggagtttattga agtttattta aaaaatagtt attgtataat 3120 ttttggtgtt attagttagttatttattaa atgtaatggg ttttgtgtag gaaaggttag 3180 aaaaaatgtg tttggaaaaaaatttatttt aataagtttt tagatttttt attttaattt 3240 ataatgtgta aatttttatttagtttttat attttttgtt tttgtttaaa aaattgttag 3300 gattggatat gggatttttagttagttatg atgttttatt taattatgtg gtttaatttg 3360 atttagaaag gttggaggattgtttaaatt attaaaataa gttgtaatat ttataggaaa 3420 ttttaataga tagatatatattaattttta attatatgag atgtgtaata ttagatgtta 3480 tttataattg tatgagtattatttttttaa ttatttatta attgtcgagt agaatttttt 3540 tttttttttt tttttatgaatgtgtttaat tttaatattt tttaga 3586 62 3586 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 62 tttagagagt attaaaattgaatatattta tgaagagaga aaaaggaaaa agttttgttc 60 gataattaat aagtaattaggaaaataata tttatatagt tgtggatagt atttggtatt 120 atatatttta tgtaattaaaaattaatgtg tatttattta ttaagatttt ttgtggatgt 180 tgtagtttat tttggtaatttagatagttt tttaattttt ttgggttaag ttaagttata 240 tagttaaata aagtattataattgattgaa aattttatgt ttaattttgg tagtttttta 300 aataggaata gaggatataagagttagatg agagtttgta tattatagat taaggtagga 360 ggtttgaaag tttattgaaatagatttttt tttaagtata ttttttttag ttttttttgt 420 ataaaattta ttatatttggtaaatagttg attaataata ttagaaatta tatagtggtt 480 attttttaaa tgaattttagtagattttat tgggatgggg tataaatttg gttgggcgga 540 gaaggttatt tatattttaaaattgtagat tgtgggaaat tgagtgtaag atttttttta 600 ttttatttat atattgggtttaattttata gagtattgtt agttaaaagt gttgtattag 660 aaatttttgg aagataggtagaaaagtatt tttttaatat atggttttaa aatgataaat 720 aattaagtat atatttttttggttattatt tgtttttaat ttagaatgaa aaatttagat 780 agatgaaata ggaatttaattttaaatagt aatgttttat attttattta aagtttttaa 840 ggattgagaa agaaagttaatttttaatgt agtttaaaga aaaagtgaga tagaatgaat 900 tagatttttt agttaaagatattatagtag ttatattttt ggaaatagga tatagtggtt 960 atatagttgg attattagagaataaatgtg attttttttt tgttgtttat tagttgtatg 1020 attttatata agttatttgatatttttata atttttaaaa tagggaaaga ttgataagag 1080 tatgaaatga acgaatgtataaaaatattt gttacggggt ttgtatatgt tagatgttta 1140 atgaatatta gttatttttattatttattt gtttaagttt taggattttt atatttttaa 1200 aaatgaagat ttaatttaataattattttt taaatatttt tgattaaaag aattattata 1260 gatatttagt aaattgtgttttttcgggat ttttttttga agattttgat taattagttt 1320 gggataaggt taggaatttgtatttttaat ttgtatatta tatgaatttt gttgtgaata 1380 ataattttat tttttagagatattagtgta tattatttgt ttttttaatt atttagatat 1440 ttatttattt atttatttatttaatttata aaatatataa tgtattattg ttatttttaa 1500 aggtattata ttatgttttgggaaatgtaa taatgaatta agtattttgt ttattgtagt 1560 ttagaaattt agtagaagttattaaataaa taattatata aatatttaaa gtgtgttata 1620 aaggaaaaat ataagatatattgagagttt ttaatagggt attatttttg tttttgatgg 1680 gggttgtaat gagtgtttaggtgagaagtt tatattttgt ttgaagaagt gattgttaag 1740 gttttttttt attttgatatcgtatattta gtatatttta tttgttaaga ggagaagaat 1800 gatgttgggt tgagtaagttaggatttgtg gggtgttgat tttttatgta tttatttgtg 1860 taaatgttat atttttttgtatttcgttag ttttaatatg gaatagtgaa gtttttattt 1920 tttgttagtt tttggattttttgtttttat cgtaataaga agagtttatg ttaaggtaga 1980 aaagttggtg ttttatgggtaaaattaatg tttttttaga ttttagattt tttaagtagt 2040 gtatttattg atatataataatgtatttag ataaagaggt tataaatatt gatgtcgtta 2100 aatatgggtg ttgatttattttttatttgg ttataggttt ttatggggat gatatagttt 2160 gagttgatgg tatgttttgttaaagtgagg taggtaaaaa atttgttttt ttttggggta 2220 tttaaatcga agatgtttttttttattaag agtcgttttt ttgtgtagtt tggtttttaa 2280 aagttaaatt tgtagtttttatagttgaat tttatgaagt tgttagagta ttggtaggtt 2340 ttattataaa agacggaaggttacgatttt cggttattta tttttgtgaa gggaaattga 2400 ggtttaagtg gtgtattggatagaaggata ttttgatagg aatttttgtt tgaaagttgg 2460 ttatagggat ttttgttttcgttttacggt ggatagtatt ttttttttat taggttttta 2520 gaggagatat aggttttagggaaatggtta gcggaggttt ggaaatttta tagtaggtag 2580 tataaaatag ttaggagtatttttttttta gtttttataa ggtttgtagg aattggttaa 2640 ttggagttat agatttttttttttagttat tattatagtg attattatat gttttggttg 2700 agatttatat aatattatttttatttttag tattaaatat ttttagtttt tattttaagt 2760 ttttattttt tgaaaagtatatgattgatt tttttttcga attggttcgt attttattag 2820 tgggataggt ttatgttaaagtgaaaaatt ttatttatta ttaatagttt aatttttatg 2880 gttagaatat taataataaggttagtaata ataatgtttg atttaagtaa atttagttaa 2940 tagattataa aattaatgatgatttgattt tgtaaatgag aggtagtgtt aggaatagag 3000 ttttttttat taagaaagtttaggaagtat taaagattat gggtttaagg tagttatttt 3060 ttagagatta taaagaggttataatgtttg aagaatttaa tatgtagaga gagattgttt 3120 ttagagttta gatagaattttttatatgtt attgaatttt agtttgttta ttttatataa 3180 cgtattagaa aaaaaaatttttttgatatt tttttttgat aattttgatg tattttttga 3240 taatttttaa ggatagttgtattttgataa ttgggcgatt tgtttattgt gggatatttt 3300 acgttaaaga gttttttttttttttttttt tttttttttt tttttttttt tttttttttt 3360 tttttttttt tttttttttttttttttttt tttttttttt tttttttttt ttttttttat 3420 tttttttttt ttttttttgttttttttttt tttttttttt tttttttatt tttttttttt 3480 tttttttgtt tttttttttttttttttttt tttttttttt tttttttttt tttttttttt 3540 ttttttttaa tgttgtagttatattgtttt ttttattaat tttaga 3586 63 600 DNA Artificial Sequencechemically treated genomic DNA (Homo sapiens) 63 ggtagcgacg atttttggaggtggatttag aggtataatt aagtcgcgcg gcgtattagg 60 gtttaagggt atggggttttcgtagttgtg gttggggtag agttggggtt gttttttttt 120 ttaggagtat aggcggcggtttagttttac gtttttcgtt tttagttata ttcggttcgc 180 gtagtggggg gtttaatagatttttttttt tcgggtttta gttttttcgt tagtaagggc 240 ggataaggat ttttttcgtttcgttagagg aggcgatcga ggggtttgag tttaggtata 300 ggtcggcggg tttaggaggcgcgaggcgga tcgaattcgc gggaggagta aagatttttg 360 atgcgcggtc ggagggcggggcggaggacg ggatttacgc gattggtatt ttgtttttcg 420 ttttagttaa tgagcggcgagggtgttttg ggggcggggt agaattagtt tttaagttgt 480 agtgacgttt cggcgttattgttgcgtttt atagacgtcg cgtgtattcg gttgttttta 540 ggcgttgtta ggtatcgtttgggcgtcgtt gttttggggt tttggttcgg gtttggtcgg 600 64 600 DNA ArtificialSequence chemically treated genomic DNA (Homo sapiens) 64 tcggttaggttcgaattaga gttttaggat agcggcgttt agacggtatt tgatagcgtt 60 tgaggataatcgggtatacg cggcgtttat gaagcgtaat agtgacgtcg gagcgttatt 120 gtaatttaaaggttgatttt gtttcgtttt taagatattt tcgtcgttta ttggttgggg 180 cggagggtaggatattaatc gcgtgggttt cgtttttcgt ttcgtttttc ggtcgcgtat 240 taaggatttttgtttttttc gcggattcga ttcgtttcgc gttttttgag ttcgtcggtt 300 tgtatttgagtttaggtttt tcggtcgttt tttttggcgg gacgagaaga gtttttgttc 360 gtttttgttgacgagaagat tgaggttcga aaaggaaaag tttgttgggt tttttattgc 420 gcgggtcgggtgtggttgga ggcgagagac gtgaggttgg atcgtcgttt gtgtttttgg 480 agggagggatagttttagtt ttgttttagt tatagttgcg ggagttttat gtttttgaat 540 tttgatgcgtcgcgcggttt agttgtgttt ttgagtttat ttttaaaagt cgtcgttgtt 600 65 20 DNAArtificial Sequence OAT primer 65 tggaggtgga tttagaggta 20 66 20 DNAArtificial Sequence OAT primer 66 aaccaaaacc ccaaaacaac 20 67 18 DNAArtificial Sequence OAT detection oligomer 67 gtgtattcgg ttgttttt 18 6818 DNA Artificial Sequence OAT detection oligomer 68 gtgtatttgg ttgttttt18

1. A nucleic acid comprising a sequence at least 18 bases in length of asegment of the chemically pretreated DNA of genes associated withmetabolism according to one of the sequences taken from the group ofSeq. ID No.1 to Seq. ID No.64 and sequences complementary thereto.
 2. Anucleic acid comprising a sequence at least 18 base pairs in length of asegment of the chemically pretreated DNA of genes associated withmetabolism according to a sequence according to one of the genes DUSP2(NM_(—)004418), EPHX2 (NM_(—)001979), QDPR (NM_(—)000320), SGSH(NM_(—)000199), SHMT2 (NM_(—)005412), SLC7A2 (NM_(—)003046), SLC7A4(NM_(—)004173), TYMS (NM_(—)001071) and sequences complementary thereto.3. An oligomer, in particular an oligonucleotide or peptide nucleic acid(PNA)-oligomer, said oligomer comprising in each case at least one basesequence having a length of at least 9 nucleotides which hybridizes toor is identical to a chemically pretreated DNA of genes associated withmetabolism according to one of the Seq ID Nos 1 to 64 according to claim1 or to a chemically pretreated DNA of genes according to claim 2 andsequences complementary thereto.
 4. The oligomer as recited in claim 3;wherein the base sequence includes at least one CpG dinucleotide.
 5. Theoligomer as recited in claim 3; characterized in that the cytosine ofthe CpG dinucleotide is located approximately in the middle third of theoligomer.
 6. A set of oligomers, comprising at least two oligomersaccording to any of claims 3 to
 5. 7. A set of oligomers as recited inclaim 6, comprising oligomers for detecting the methylation state of allCpG dinucleotides within one of the sequences according to Seq. ID Nos.1 through 64 according to claim 1 or a chemically pretreated DNA ofgenes according to claim 2, and sequences complementary thereto.
 8. Aset of at least two oligonucleotides as recited in claim 3, which can beused as primer oligonucleotides for the amplification of DNA sequencesof one of Seq. ID 1 through Seq. ID 64 and sequences complementarythereto and/or sequences of a chemically pretreated DNA of genesaccording to claim 2, and sequences complementary thereto and segmentsthereof.
 9. A set of oligonucleotides as recited in claim 8,characterized in that at least one oligonucleotide is bound to a solidphase.
 10. Use of a set of oligomer probes comprising at least ten ofthe oligomers according to any of claims 6 through 9 for detecting thecytosine methylation state and/or single nucleotide polymorphisms (SNPs)in a chemically pretreated genomic DNA according to claim 1 or achemically pretreated DNA of genes according to claim
 2. 11. A methodfor manufacturing an arrangement of different oligomers (array) fixed toa carrier material for analyzing diseases associated with themethylation state of the CpG dinucleotides of one of the Seq. ID 1through Seq. ID 64 and sequences complementary thereto and/or chemicallypretreated DNA of genes according to claim 2, wherein at least oneoligomer according to any of the claims 3 through 5 is coupled to asolid phase.
 12. An arrangement of different oligomers (array)obtainable according to claim
 11. 13. An array of differentoligonucleotide- and/or PNA-oligomer sequences as recited in claim 12,characterized in that these are arranged on a plane solid phase in theform of a rectangular or hexagonal lattice.
 14. The array as recited inany of the claims 12 or 13, characterized in that the solid phasesurface is composed of silicon, glass, polystyrene, aluminium, steel,iron, copper, nickel, silver, or gold.
 15. A DNA- and/or PNA-array foranalyzing diseases associated with the methylation state of genes,comprising at least one nucleic acid according to one of the preceedingclaims.
 16. A method for ascertaining genetic and/or epigeneticparameters for the diagnosis and/or therapy of existing diseases or thepredisposition to specific diseases by analyzing cytosine methylations,characterized in that the following steps are carried out: a) in agenomic DNA sample, cytosine bases which are unmethylated at the5-position are converted, by chemical treatment, to uracil or anotherbase which is dissimilar to cytosine in terms of hybridization behavior;b) fragments of the chemically pretreated genomic DNA are amplifiedusing sets of primer oligonucleotides according to claim 8 or 9 and apolymerase, the amplificates carrying a detectable label; c)Amplificates are hybridized to a set of oligonucleotides and/or PNAprobes according to the claims 6 and 7, or else to an array according toone of the claims 12 through 15; d) the hybridized amplificates aresubsequently detected.
 17. The method as recited in claim 16,characterized in that the chemical treatment is carried out by means ofa solution of a bisulfite, hydrogen sulfite or disulfite.
 18. The methodas recited in one of the claims 16 or 17, characterized in that morethan ten different fragments having a length of 100-2000 base pairs areamplified.
 19. The method as recited in one of the claims 16 through 18,characterized in that the amplification of several DNA segments iscarried out in one reaction vessel.
 20. The method as recited in one ofthe claims 16 through 19, characterized in that the polymerase is aheat-resistant DNA polymerase.
 21. The method as recited in claim 20,characterized in that the amplification is carried out by means of thepolymerase chain reaction (PCR).
 22. The method as recited in one of theclaims 16 through 21, characterized in that the labels of theamplificates are fluorescence labels.
 23. The method as recited in oneof the claims 16 through 21, characterized in that the labels of theamplificates are radionuclides.
 24. The method as recited in one of theclaims 16 through 21, characterized in that the labels of theamplificates are detachable molecule fragments having a typical masswhich are detected in a mass spectrometer.
 25. The method as recited inone of the claims 16 through 21, characterized in that the amplificatesor fragments of the amplificates are detected in the mass spectrometer.26. The method as recited in one of the claims 24 and/or 25,characterized in that the produced fragments have a single positive ornegative net charge for better detectability in the mass spectrometer.27. The method as recited in one of the claims 24 through 26,characterized in that detection is carried out and visualized by meansof matrix assisted laser desorption/ionization mass spectrometry (MALDI)or using electron spray mass spectrometry (ESI).
 28. The method asrecited in one of the claims 16 through 27, characterized in that thegenomic DNA is obtained from cells or cellular components which containDNA, sources of DNA comprising, for example, cell lines, biopsies,blood, sputum, stool, urine, cerebral-spinal fluid, tissue embedded inparaffin such as tissue from eyes, intestine, kidney, brain, heart,prostate, lung, breast or liver, histologic object slides, and allpossible combinations thereof.
 29. A kit comprising a bisulfite(=disulfite, hydrogen sulfite) reagent as well as oligonucleotidesand/or PNA-oligomers according to one of the claims 3 through
 5. 30. Theuse of a nucleic acid according to claims 1 or 2, of an oligonucleotideor PNA-oligomer according to one of the claims 3 through 5, of a kitaccording to claim 29, of an array according to one of the claims 12through 15, of a set of oligonucleotides according to one of claims 6through 9 for the diagnosis of metabolic disease, solid tumours andcancers.
 31. The use of a nucleic acid according to claims 1 or 2, of anoligonucleotide or PNA-oligomer according to one of claims 3 through 5,of a kit according to claim 29, of an array according to one of theclaims 12 through 15, of a set of oligonucleotides according to one ofclaims 6 through 9 for the therapy of metabolic disease, solid tumoursand cancers.
 32. A kit, comprising a bisulfite (=disulfite, hydrogensulfite) reagent as well as oligonucleotides and/or PNA-oligomersaccording to one of claims 3 through 5.